正在加载图片...
·85· 骆彦龙,等:基于改进残差学习的东巴象形文字识别 第1期 了本文改进残差跳跃连接加最大池化网络模型的 从图6可以看出,“水槽”和“水涧”,“侧视之 有效性。 人”和“左”或“爬”等字的区别仅仅体现在线条的 3.3.2算法的先进性验证 弯曲程度不同;“腰”和“爬”更多体现在它们之间 为了验证本文改进网络模型的先进性,在相 大小有所差异:“神山山脚”和“神山山腰”,“中”和 同的实验环境下,本文分别与文献[8]采用的Res “矛”主要体现在图像上部分所画的高度不同;“尾 Netl8网络模型、文献[9]采用的VGGNet网络模 巴”和“树倒”的差异体现在右下角线条的长度和 型以及文献[I0]采用的20层ResNet网络模型进 弯曲程度;“臂膀”和“手”则几乎相同。 行了对比实验,实验结果如表6所示。 可见,东巴象形文字中有很多相似乃至接近 表6算法先进性验证实验 “相同”的文字,又因为东巴象形文字的手工书写 Table 6 Experiment of model advancement verification 形式,随意性较大,这些相似的东巴象形文字在 测试模型 识别准确率/% 书写过程中极容易导致差异性变小、辨识度下 ResNet18文献[8] 98.22 降,这是影响东巴象形文字识别准确率的主要 VGGNet文献I9] 98.34 原因。 ResNet20文献[1O] 97.7 ResNet34 98.01 4结束语 本文算法 98.65 针对现有东巴象形文字识别方法存在的识别 从表6中可以看出,本文改进的网络模型识 文字数量少、识别准确率较低等问题,本文首先 别准确率最高,相较于文献[8]的方法提高了 建立了包含1387个东巴象形文字(包括异体字)、 0.43%:相较于文献[9]的方法提高了0.31%:相较 图片总量达到22万余张的东巴象形文字数据集, 于文献[10]的方法提高了0.95%。充分验证了本 可识别的东巴象形文字大幅增加。通过扩大数据 文改进网络模型的先进性。 集的规模,辅助提高了算法识别的准确率;更为 同时,本文又与层数有所增加的ResNet34网 络进行了对比性实验。从表6中可以看出,34层 重要的是本文选择ResNet模型作为改进的网络 网络模型的识别准确率不仅低于本文的33层网 结构,设计了残差跳跃连接方式和卷积层的数 络模型,而且也低于18层的网络模型,这说明网 量,并通过加入最大池化层实现了对下采样的改进, 络层数的简单叠加在具体的东巴象形文字识别中 更好地提取了东巴象形文字的纹理分布特征。通 不一定获得更好的识别效果。 过对1387个东巴象形文字(包括异体字)分别进 3.4存在的问题 行测试,实验结果表明,本文提出的改进ResNet 虽然本文取得了98.65%的识别准确率,但对 模型识别准确率平均达到98.65%,取得了当前识 于误识别问题我们又进行了深入分析,通过观察 别字数最多、识别准确率最高的效果。 多次实验结果,发现错误识别的东巴象形文字都 未来将继续扩大东巴象形文字数据集的文字 有一个共同的特点,那就是都有与之非常相似的东 数量,力争包含现存的所有东巴象形文字。针对 巴象形文字,图6给出了部分相似文字的示例。 其中相似度极高的文字,将研究设计专门的网络 模型来有效将它们区别开来,从而进一步提高东 巴象形文字识别的准确率。 水槽 水涧 神山山脚神山山腰 参考文献: 侧视之人 左 中 [1]GUO Hai,ZHAO Jingying,LI Xiaoniu.Preprocessing method for NaXi pictographs character recognition using wavelet transform[J].International journal of digital con- 侧视之人 尾巴 树倒 tent technology and its applications,2010,4(3):117-131. [2]GUO Hai,ZHAO Jingying.Research on feature extrac- tion for character recognition of NaXi pictograph[J]. 腰 爬 臂膀 Journal of computers,2011,6(5):947-954. 图6相似东巴象形文字示例 [3]DA Mingjun,ZHAO Jingying.SUO Guojie,et al.Online Fig.6 Samples of similar Dongba pictographs handwritten Naxi pictograph digits recognition system us-了本文改进残差跳跃连接加最大池化网络模型的 有效性。 3.3.2 算法的先进性验证 为了验证本文改进网络模型的先进性,在相 同的实验环境下,本文分别与文献 [8] 采用的 Res￾Net18 网络模型、文献 [9] 采用的 VGGNet 网络模 型以及文献 [10] 采用的 20 层 ResNet 网络模型进 行了对比实验,实验结果如表 6 所示。 表 6 算法先进性验证实验 Table 6 Experiment of model advancement verification 测试模型 识别准确率/% ResNet18文献[8] 98.22 VGGNet文献[9] 98.34 ResNet20文献[10] 97.7 ResNet34 98.01 本文算法 98.65 从表 6 中可以看出,本文改进的网络模型识 别准确率最高,相较于文献 [8] 的方法提高了 0.43%;相较于文献 [9] 的方法提高了 0.31%;相较 于文献 [10] 的方法提高了 0.95%。充分验证了本 文改进网络模型的先进性。 同时,本文又与层数有所增加的 ResNet34 网 络进行了对比性实验。从表 6 中可以看出,34 层 网络模型的识别准确率不仅低于本文的 33 层网 络模型,而且也低于 18 层的网络模型,这说明网 络层数的简单叠加在具体的东巴象形文字识别中 不一定获得更好的识别效果。 3.4 存在的问题 虽然本文取得了 98.65% 的识别准确率,但对 于误识别问题我们又进行了深入分析,通过观察 多次实验结果,发现错误识别的东巴象形文字都 有一个共同的特点,那就是都有与之非常相似的东 巴象形文字,图 6 给出了部分相似文字的示例。 水槽 水涧 侧视之人 左 侧视之人 爬 爬 神山山脚 神山山腰 尾巴 树倒 中 腰 臂膀 手 矛 图 6 相似东巴象形文字示例 Fig. 6 Samples of similar Dongba pictographs 从图 6 可以看出,“水槽”和“水涧”,“侧视之 人”和“左”或“爬”等字的区别仅仅体现在线条的 弯曲程度不同;“腰”和“爬”更多体现在它们之间 大小有所差异;“神山山脚”和“神山山腰”,“中”和 “矛”主要体现在图像上部分所画的高度不同;“尾 巴”和“树倒”的差异体现在右下角线条的长度和 弯曲程度;“臂膀”和“手”则几乎相同。 可见,东巴象形文字中有很多相似乃至接近 “相同”的文字,又因为东巴象形文字的手工书写 形式,随意性较大,这些相似的东巴象形文字在 书写过程中极容易导致差异性变小、辨识度下 降,这是影响东巴象形文字识别准确率的主要 原因。 4 结束语 针对现有东巴象形文字识别方法存在的识别 文字数量少、识别准确率较低等问题,本文首先 建立了包含 1 387 个东巴象形文字 (包括异体字)、 图片总量达到 22 万余张的东巴象形文字数据集, 可识别的东巴象形文字大幅增加。通过扩大数据 集的规模,辅助提高了算法识别的准确率;更为 重要的是本文选择 ResNet 模型作为改进的网络 结构,设计了残差跳跃连接方式和卷积层的数 量,并通过加入最大池化层实现了对下采样的改进, 更好地提取了东巴象形文字的纹理分布特征。通 过对 1 387 个东巴象形文字 (包括异体字) 分别进 行测试,实验结果表明,本文提出的改进 ResNet 模型识别准确率平均达到 98.65%,取得了当前识 别字数最多、识别准确率最高的效果。 未来将继续扩大东巴象形文字数据集的文字 数量,力争包含现存的所有东巴象形文字。针对 其中相似度极高的文字,将研究设计专门的网络 模型来有效将它们区别开来,从而进一步提高东 巴象形文字识别的准确率。 参考文献: GUO Hai, ZHAO Jingying, LI Xiaoniu. Preprocessing method for NaXi pictographs character recognition using wavelet transform[J]. International journal of digital con￾tent technology and its applications, 2010, 4(3): 117–131. [1] GUO Hai, ZHAO Jingying. Research on feature extrac￾tion for character recognition of NaXi pictograph[J]. Journal of computers, 2011, 6(5): 947–954. [2] DA Mingjun, ZHAO Jingying, SUO Guojie, et al. Online handwritten Naxi pictograph digits recognition system us- [3] ·85· 骆彦龙,等:基于改进残差学习的东巴象形文字识别 第 1 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有