正在加载图片...
·1214· 智能系统学报 第14卷 扩展的YaleB数据库:由38个人的2414个 数据库的一个小子集Char74K-15,其中包含15个 人脸图像组成,每个人有59~64个亮度不同的图 训练样本和15个测试样本。 像。在实验过程中,随机选择其中的20、25、30、35 表2扩展YaleB数据库中不同数量训练集中不同方法 个图像作为训练集,其余的作为测试集进行实验。 的兰德指数(R 图2为LBKA获得的扩展YaleB数据库的数 Table 2 Rand index of different methods of different numbers of training samples on the Extended 据表示,从中可以看出获得的矩阵为对角分块结 YaleB database(RI) % 构。表1和表2分别是扩展的YaleB数据库中不 训练集数量 同算法的识别精度和兰德指数。从中可以看出, 算法 在使用不同数量的训练集进行实验时,LBKA都 20 25 30 35 能得到最好的识别结果。而且随着样本数量的增 LRC 91.25 92.63 93.35 93.76 加,LBKA的识别精度也随之逐渐提高。 RPCA 94.61 94.84 95.75 95.96 SVM 93.28 95.51 92.65 96.96 BDLRR 96.34 97.11 96.37 97.03 LBKA 97.82 98.53 97.89 99.11 表3和表4列出了LBKA和其他字符识别方 法的识别准确度和兰德指数,从中可以看出,LB KA识别的准确度和兰德指数都是最高的。 表3场景角色数据库上不同方法的准确度 Table 3 Recognition accuracies of different methods onthe scene character database. % 图2LBKA获得的扩展YaleB数据库的数据表示 算法 准确度 Fig.2 Data representation of the Extended YaleB data- CoHOG 63 baseobtained by LBKA PHOG 65 表1扩展YaleB数据库中不同数量训练集中不同方法 MLFP 64 的准确度(Acc±std RTPD 67 Table 1 Recognition accuracies of different methods of BDLRR 70 different numbers of training samples on the Extended YaleB database (Acc+std) LBKA 13 % 训练集数量 表4场景角色数据库上不同方法的兰德指数 算法 Table 4 Rand index of different methods on the 20 25 30 35 scenecharacter database. % LRC 92.15±0.9593.55±0.6594.55±0.6895.4940.55 算法 兰德指数 RPCA93.58±0.6195.51±0.36 96.70±0.4696.96±0.49 CoHOG 60 SVM 92.81±0.6895.20±0.44 96.11±0.41 96.70±0.69 PHOG 63 BDLRR94.67±0.3195.79±0.2996.46±0.1596.81±0.14 MLFP 61 LBKA97.46±0.6798.22±0.4298.67±0.4699.26±0.29 RTPD 68 BDLRR 72 4.4字符识别 LBKA 74 本文选取Char74K场景人物图像数据集来 进行实验。在以往的模式识别任务中,由于场景 4.5 实验分析 图像十分复杂,很难将想要识别的文本分离出 首先,与两种数据集上的对比算法相比,LB- 来,而LBKA中对类内类外的处理有助于对场景 KA进行模式识别时更加准确。 中字符进行提取。本文将LBKA与其他先进的字 其次,LBKA比现有的识别算法更准确,这说 符识别算法进行对比,包括CoHOG9、RTPD2 明扩大了对角块和非对角块之间的差异的同时增 PHOGP、MLFP2和BDLRR。 强了相关数据表示,能够获得更好的识别效果。 Char74K数据库:该数据库总共包含7万4千 第三,LBKA在识别数量有限的样本时比其 幅图像,所以叫Chars?74K。本文主要关注其中英 它对比算法都好。主要原因是LBKA具有稀疏, 语字符和数字的识别。本文在实验中只使用了原 低秩和分块三大特性。低秩可以有效地挖掘数据扩展的 YaleB 数据库:由 38 个人的 2 414 个 人脸图像组成,每个人有 59~64 个亮度不同的图 像。在实验过程中,随机选择其中的 20、25、30、35 个图像作为训练集,其余的作为测试集进行实验。 图 2 为 LBKA 获得的扩展 YaleB 数据库的数 据表示,从中可以看出获得的矩阵为对角分块结 构。表 1 和表 2 分别是扩展的 YaleB 数据库中不 同算法的识别精度和兰德指数。从中可以看出, 在使用不同数量的训练集进行实验时,LBKA 都 能得到最好的识别结果。而且随着样本数量的增 加,LBKA 的识别精度也随之逐渐提高。 图 2 LBKA 获得的扩展 YaleB 数据库的数据表示 Fig. 2 Data representation of the Extended YaleB data￾baseobtained by LBKA 表 1 扩展 YaleB 数据库中不同数量训练集中不同方法 的准确度 (Acc±std) Table 1 Recognition accuracies of different methods of different numbers of training samples on the Extended YaleB database (Acc±std) % 算法 训练集数量 20 25 30 35 LRC 92.15±0.95 93.55±0.65 94.55±0.68 95.49±0.55 RPCA 93.58±0.61 95.51±0.36 96.70±0.46 96.96±0.49 SVM 92.81±0.68 95.20±0.44 96.11±0.41 96.70±0.69 BDLRR 94.67±0.31 95.79±0.29 96.46±0.15 96.81±0.14 LBKA 97.46±0.67 98.22±0.42 98.67±0.46 99.26±0.29 4.4 字符识别 本文选取 Char74K 场景人物图像数据集[5] 来 进行实验。在以往的模式识别任务中,由于场景 图像十分复杂,很难将想要识别的文本分离出 来,而 LBKA 中对类内类外的处理有助于对场景 中字符进行提取。本文将 LBKA 与其他先进的字 符识别算法进行对比,包括 CoHOG[19] 、RTPD[20] , PHOG[21] 、MLFP[22] 和 BDLRR[5]。 Char74K 数据库:该数据库总共包含 7 万 4 千 幅图像,所以叫 Chars74K。本文主要关注其中英 语字符和数字的识别。本文在实验中只使用了原 数据库的一个小子集 Char74K-15,其中包含 15 个 训练样本和 15 个测试样本。 表 2 扩展 YaleB 数据库中不同数量训练集中不同方法 的兰德指数 (RI) Table 2 Rand index of different methods of different numbers of training samples on the Extended YaleB database(RI) % 算法 训练集数量 20 25 30 35 LRC 91.25 92.63 93.35 93.76 RPCA 94.61 94.84 95.75 95.96 SVM 93.28 95.51 92.65 96.96 BDLRR 96.34 97.11 96.37 97.03 LBKA 97.82 98.53 97.89 99.11 表 3 和表 4 列出了 LBKA 和其他字符识别方 法的识别准确度和兰德指数,从中可以看出,LB￾KA 识别的准确度和兰德指数都是最高的。 表 3 场景角色数据库上不同方法的准确度 Table 3 Recognition accuracies of different methods onthe scene character database. % 算法 准确度 CoHOG 63 PHOG 65 MLFP 64 RTPD 67 BDLRR 70 LBKA 73 表 4 场景角色数据库上不同方法的兰德指数 Table 4 Rand index of different methods on the scenecharacter database. % 算法 兰德指数 CoHOG 60 PHOG 63 MLFP 61 RTPD 68 BDLRR 72 LBKA 74 4.5 实验分析 首先,与两种数据集上的对比算法相比,LB￾KA 进行模式识别时更加准确。 其次,LBKA 比现有的识别算法更准确,这说 明扩大了对角块和非对角块之间的差异的同时增 强了相关数据表示,能够获得更好的识别效果。 第三,LBKA 在识别数量有限的样本时比其 它对比算法都好。主要原因是 LBKA 具有稀疏, 低秩和分块三大特性。低秩可以有效地挖掘数据 ·1214· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有