谢胜利相关研究成果介绍④：矩阵分解不只会做降维，也能被拿来设计一套可重复使用的多媒体密码系统

2026-05-19

矩阵分解不只会做降维，也能被拿来设计一套可重复使用的多媒体密码系统

一、研究背景与问题提出

语音和图像加密与传统文本加密并不完全一样，因为连续信号的恢复目标常常不是逐点完全一致，而是尽可能可靠地保留主要结构信息。2008 年这篇论文的有趣之处就在于，它没有沿着经典密码学的主路往前走，而是把非负矩阵分解这类信号处理工具直接转化成密码系统设计的一部分。

作者的出发点很明确：既有一些基于 ICA 或 BSS 的加密方案，但它们往往依赖一次性填充或者对信号独立性有较强要求，不够适合实际可重复使用的多媒体场景。于是文章尝试把 NMF 的单向分解特性和 nonlinear mixing 结合起来，构造一种更实用的非线性语音与图像 cryptosystem。

二、核心方法与关键机制

论文提出的总体结构是“nonlinear mixing 加密，NMF 解密”。在加密端，原始语音或图像先通过非线性混合模型并叠加强噪声；在解密端，再利用 NMF 的分解能力恢复出明文成分。方法安全性主要依赖两个事实：构造出的多变量非线性函数不可逆，以及当混合矩阵的逆不满足非负性时，NMF 分解过程本身具备明显的单向性。

论文核心系统图：基于非线性混合与 NMF 解密的语音图像密码系统框架。

这个设计的妙处在于，它不是把 NMF 当成一个普通后处理工具，而是把分解的可行性和不可逆性直接纳入加密机制。这样一来，矩阵分解不再只是分析数据，而是在系统层面参与定义“为什么别人难以解密，而接收方可以解密”。

论文还处理了一个很实际的问题：重构后的排列歧义如何解决。作者没有继续使用零交叉数这类容易不稳定的方法，而是引入基于峰度的改进策略来恢复波形顺序。这个小改动很有工程意味，因为它直接决定了加密方案在真实语音和图像恢复中的可操作性。

三、实验结果与结论

实验结果显示，该 cryptosystem 能够在不要求明文和密文满足特定统计性质的情况下完成有效加密和解密，并且相比某些依赖 one-time padding 的方案更适合重复使用。也就是说，论文证明了 NMF 不仅能做信号表示，还能支撑一套实际可运行的多媒体密码机制。

作者给出的核心判断是，矩阵分解类方法完全可以从“信号分离工具”扩展为“安全系统组件”，而且这种扩展并不只是概念演示，而能落到语音和图像的实际加密解密流程里。这个判断本身就很有跨界意味。

四、研究价值与启示

善于把一个在信号处理中成熟的基础方法，重新搬到另一个场景里，并让它在系统层面承担新角色。这样的工作不只是应用迁移，更是问题重构能力的体现。

作者简介：谢胜利，广东工业大学自动化学院教授、博士生导师。长期从事控制、信号处理与智能信息处理等领域的教学与研究，研究工作涉及无线通信与网络、物联网信息技术等方向。现为国家杰出青年科学基金获得者、国家自然科学二等奖第一完成人。