正在加载图片...
第5期 林大华,等:稀疏样本自表达子空间聚类算法 ·699. 数。但值得注意的是,D,和D依赖于Z,因此也是未 是式(3)的一个全局最优解,因此,算法2可将问题 知的。根据文献[11-13],本文提出了一种迭代算法 (3)收敛到全局最优解。另外,在每一次迭代时都 去求解这个问题。 有封闭形式的解,因此我们的算法收敛非常快。 算法2目标函数优化算法 4实验分析与讨论 输入数据集X; 输出Z()E Rkn; 4.1实验数据集及评价指标 初始化Z)∈R",t=1: 本文算法通过MATLAB语言编程,且所有实验 do 都是在win7系统下的MATLAB2014软件上运行测 试。实验用到的数据集介绍如下。 1)计算对角矩阵D.o(1≤i≤n)和Do其中 Hopkins155[1]数据集被广泛用来测试各种子 D,的第k个对角元素为1 Do的第k个对 空间聚类算法。该数据集由156个视频序列组成, 2|Z0 一个序列对应一个数据集,所以其共有156个数据 角元素为 1 2I(Zo)*I, 集,并且每个序列中包含2或3个运动物体目标。 Jaffe[16]数据集由日本ATR表情识别研究协会 2)For每个i(1≤i≤n),计算 提供,该数据集包含10个人的213张表情图像,每 Z(D)=(XX+A D(+A2 D()-XX 张表情图像经过预处理被裁剪为32像素×32像素 3)t=t+1: 大小的尺度。 }until收敛。 USPs1刊数据集是由美国国家邮政局提供, 由上述算法2的描述知,优化目标函数的关键 数据集含有9298个0~10的手写数字数据集,每个 是目标值Z)要在迭代中收敛。下面证明目标函 手写数字数据经预处理都被裁剪为16像素×16像 数(2)的目标值在每一次迭代中都会减小。根据算 素大小的尺度。用每个数字的前100个图像进行 法2的第2步,可得 实验。 Z(D)minTr (X -XZ)"(-XZ) ORLi)数据集是由剑桥Olivetti实验室提供, AD Z+ATr Z Dz 数据集包含40人的共400张面部图像,每张人脸数 (5) 据经预处理被裁剪为16像素×16像素大小的尺度。 由式(5),可得 为了验证算法的性能,将目前较好的子空间聚 Tr (X-XZ(D))T(X-XZ(D))+ 类算法LSR、LRR和SSC与本文算法进行对比实 A宫(2)rnzw+ 验。为了保证算法的公平性,所有算法都没有对数 据进行后期处理。 A2Tr(Z+)TDZ+1)≤ 子空间聚类的重要挑战是处理存在于数据中的 Tr (X-XZ()(X-XZ())+ 错误。因此,本文将子空间聚类错误率作为衡量各 A()D()D 个算法性能的评价标准。其中,错误率越小,子空间 聚类效果越好:反之,则越差。其定义为 于是,可推导出 Tr (X-XZ(+D)T(X-XZ(D)+ 子空间聚类错误率=错误分类的样本数 样本总数 A豆三z1+A三 I(Z+)I2≤ 4.2实验结果与分析 4.2.1 Hopkins155数据集上的实验 Tr(X-XZ)T(X-XZo)》 由于Hopkins155数据集包含156个不同的数 A三含1四 ,‖(Zo)I2 据集,根据文献[19],本文将156个数据集中的子 空间聚类错误率的最大值(Max)、均值(Mean)和中 根据文献[14],对于任意向量Z和Z。,有 值(Median)以及标准差(Std)作为评价指标。对 z且≤1z21ZT 1Z,1212Z12 IZoll 。由以上分 LSR,LRR,SSC以及本文算法SSR_SC在该数据集 进行了对比,实验结果如表1所示。 析可知,算法2中的目标值在每一次迭代中都会减 通过分析表1可知,在Hopkins155数据集上, 小。ZD(1≤i≤n)和D在收敛处满足等式 本文提出的SSR_SC比LSR、LRR和SSC获得了更 (5),且目标函数(2)是凸函数,于是此时得到的Z 好的子空间聚类效果。具体地,SSR_SC与LSR算数。 但值得注意的是,Di 和D ~ 依赖于 Z,因此也是未 知的。 根据文献[11⁃13],本文提出了一种迭代算法 去求解这个问题。 算法 2 目标函数优化算法 输入 数据集 X; 输出 Z (t)∈R n×n ; 初始化Z (1)∈R n×n ,t = 1; do{ 1)计算对角矩阵Di (t) ( 1≤i≤n) 和D ~ (t) 其中 Di (t)的第 k 个对角元素为 1 2 Z (t) ki ,D ~ (t) 的第 k 个对 角元素为 1 2 ‖(Z (t) ) k‖2 ; 2)For 每个 i(1≤i≤n),计算 Z (t+1) i = (X TX + λ1 D (t) i + λ2 D ~ (t) ) -1 X TX 3)t = t+1; }until 收敛。 由上述算法 2 的描述知,优化目标函数的关键 是目标值Z (t+1) i 要在迭代中收敛。 下面证明目标函 数(2)的目标值在每一次迭代中都会减小。 根据算 法 2 的第 2 步,可得 Z (t+1) = min Z Tr (X - XZ) T (X - XZ) + λ1∑ n i = 1 Z T i D (t) i Zi + λ2Tr Z T D ~ (t)Z (5) 由式(5),可得 Tr (X - XZ (t+1) ) T (X - XZ (t+1) ) + λ1∑ n i = 1 (Z (t+1) i ) T D (t) i Z (t+1) i + λ2Tr (Z (t+1) ) T D ~ (t) Z (t+1) ≤ Tr (X - XZ (t) ) T (X - XZ (t) ) + λ1∑ n i = 1 (Z (t) i ) T D (t) i Z (t) i + λ2Tr (Z (t) ) T D ~ (t) Z (t) 于是,可推导出 Tr (X - XZ (t+1) ) T (X - XZ (t+1) ) + λ1∑ d i = 1 ∑ n j = 1 ‖Z (t+1) ij ‖ + λ2∑ d k = 1 ‖ (Z (t+1) ) k‖2 ≤ Tr (X - XZ (t) ) T (X - XZ (t) ) λ1∑ d i = 1 ∑ n j = 1 (‖Z (t) ij ‖) + λ2∑ d k = 1 ‖ (Z (t) ) k‖2 根据文献 [ 14], 对于任意向量 Z 和 Z0 , 有 ‖Z2‖- ‖Z‖2 2 2 ‖Z0‖2 ≤‖Z0‖2 - ‖Z0‖2 2 2 ‖Z0‖2 。 由以上分 析可知,算法 2 中的目标值在每一次迭代中都会减 小。 Z (t) 、D (t) i (1≤i≤n) 和D ~ (t) 在收敛处满足等式 (5),且目标函数(2)是凸函数,于是此时得到的 Z 是式(3)的一个全局最优解,因此,算法 2 可将问题 (3)收敛到全局最优解。 另外,在每一次迭代时都 有封闭形式的解,因此我们的算法收敛非常快。 4 实验分析与讨论 4.1 实验数据集及评价指标 本文算法通过 MATLAB 语言编程,且所有实验 都是在 win7 系统下的 MATLAB 2014 软件上运行测 试。 实验用到的数据集介绍如下。 Hopkins155 [15]数据集被广泛用来测试各种子 空间聚类算法。 该数据集由 156 个视频序列组成, 一个序列对应一个数据集,所以其共有 156 个数据 集,并且每个序列中包含 2 或 3 个运动物体目标。 Jaffe [16]数据集由日本 ATR 表情识别研究协会 提供,该数据集包含 10 个人的 213 张表情图像,每 张表情图像经过预处理被裁剪为 32 像素×32 像素 大小的尺度。 USPS [17]数据集是由 美 国 国 家 邮 政 局 提 供, 数据集含有 9 298 个 0~10 的手写数字数据集,每个 手写数字数据经预处理都被裁剪为 16 像素×16 像 素大小的尺度。 用每个数字的前 100 个图像进行 实验。 ORL [18]数据集是由剑桥 Olivetti 实验室提供, 数据集包含 40 人的共 400 张面部图像,每张人脸数 据经预处理被裁剪为 16 像素×16 像素大小的尺度。 为了验证算法的性能,将目前较好的子空间聚 类算法 LSR、LRR 和 SSC 与本文算法进行对比实 验。 为了保证算法的公平性,所有算法都没有对数 据进行后期处理。 子空间聚类的重要挑战是处理存在于数据中的 错误。 因此,本文将子空间聚类错误率作为衡量各 个算法性能的评价标准。 其中,错误率越小,子空间 聚类效果越好;反之,则越差。 其定义为 子空间聚类错误率= 错误分类的样本数 样本总数 4.2 实验结果与分析 4.2.1 Hopkins155 数据集上的实验 由于 Hopkins155 数据集包含 156 个不同的数 据集,根据文献[19],本文将 156 个数据集中的子 空间聚类错误率的最大值(Max)、均值(Mean)和中 值(Median) 以及标准差( Std) 作为评价指标。 对 LSR,LRR,SSC 以及本文算法 SSR_SC 在该数据集 进行了对比,实验结果如表 1 所示。 通过分析表 1 可知,在 Hopkins155 数据集上, 本文提出的 SSR_SC 比 LSR、LRR 和 SSC 获得了更 好的子空间聚类效果。 具体地,SSR_SC 与 LSR 算 第 5 期 林大华,等:稀疏样本自表达子空间聚类算法 ·699·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有