正在加载图片...
第5卷第4期 智能系统学报 Vol.5 No.4 2010年8月 CAAI Transactions on Intelligent Systems Aug.2010 doi:10.3969/i.issn.1673-4785.2010.04.006 动态学习的非负矩阵分解算法 杨志君,叶东毅 (福州大学数学与计算机科学学院,福建福州350108) 摘要:为在对现有增量型非负矩阵分解算法存在的一些缺陷进行改进.给出了一个基于误差判断的增量算法有效 性准则.在此基础上,利用增加样本前的非负矩阵分解结果进行增量分解初始化,提出了一种新的动态非负矩阵分 解算法.在多个数据集上的实验结果表明该算法可以实现对基矩阵和编码矩阵的即时更新,且具有较低的计算复杂 度,在处理动态数据集时,还可有效识别噪声点,是一个可行有效的动态分解算法. 关键词:非负矩阵分解;动态学习;初始化;误差准则 中图分类号:TP181文献标识码:A文章编号:16734785(2010)04032007 A dynamic learning algorithm based on non-negative matrix factorization YANG Zhi-jun,YE Dong-yi College of Mathematics and Computer Science,Fu Zhou University,Fu Zhou 350108,China) Abstract:To improve the performance of the incremental non-negative matrix factorization algorithm,error estima- tion criteria for judging the effectiveness of the incremental algorithm was presented.Then,a new dynamic non- negative matrix factorization algorithm was proposed whereby incremental factorization was initialized with the al- ready factorized matrices before adding new samples.Experimental results on a number of data sets showed that the proposed algorithm is capable of instantly updating both the base matrix and the code matrix.Another benefit of the method is that the computational complexity is relatively low.The proposed algorithm can also identify noise points when dealing with dynamic data.So it is a feasible and effective dynamic factorization algorithm. Keywords:non-negative matrix factorization;dynamic learning;initialization error criteria 近年来非负矩阵分解方法(nonnegative matrix需要随样本数的动态增加做相应的调整.例如,在分 factorization,NMF)l14在聚类分析、人脸识别、语音析疫情的病例时,将每个病人所需测量的生理参数 识别、声音分离等领域取得了很好的应用.但NMF 是否异常作为二值(0,1)样本,则分解产生的基矩 也存在一些缺陷,如不能动态地、实时地处理加入的 阵和编码矩阵分别为各个症状(包含若干个有可能 数据向量,当加入新的数据向量时只能将所有的数 异常的生理参数)和每个病例可能具有的若干症 据向量重新计算得到基矩阵和编码矩阵,这在大规 状.当出现新的病例时,应重新调整对各个病人的诊 模数据的处理中显得不太合理。 断,即他们的症状.保持编码矩阵不变显然是不合理 针对以上问题,人们已经提出了若干增量型 的.Co[61等人在满足矩阵分解惟一性的条件下,使 NMP算法.例如,Bucak等人[S1提出了一种增量非负 用原基矩阵和新样本来更新基矩阵,得到一种新的 矩阵分解算法(incremental nonnegative matirx factori- 动态非负矩阵分解算法(online nonnegative matrix zation,INMF).该算法在增加新样本时,保持原样本 factorization,ONMF),但它是以NMF满秩分解为前 数据集编码不变,通过一个加权目标函数来控制矩 提的.因此,该算法不适用于要求基向量的个数小于 阵分解的无记忆性.但在实际应用中样本编码经常 样本矩阵的秩时的情况.文献[7]中提出一种动态 分块非负矩阵分解算法BNMF,该算法运用分块的 收稿日期:2009-0608. 基金项目:国家自然科学基金资助项目(60805042) 思想对NMP算法进行修改.将大矩阵按每类进行分 通信作者:叶东毅.E-mail:yicd@zu.cdu.cn. 块,即同一类的训圳练样本形成一块小矩阵,然后对每
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有