正在加载图片...
·404 智能系统学报 第4卷 测试结果如表1所示,从表中可以看出,系统的 6)输人文字:我自然是不赞成的, 平均单字识别率为92.2%,而综合识别率平均达到 识别结果:战自然足不赞或的, 了98.1%,提高近6%,综合校正率平均为74.2%. 综合结果:我自然是不赞成的, 表1文本识别实验结果 7)输入文字:亿万农民解放思想更新观念 Table 1 Experimental results on character recognition 识别结果:亿万农民解放怠想更新观念 单字 综合 综合结果:亿万农民解放思想更新观念 书写者 字数 综合 识别率/% 识别率/% 校正率/% 8)输入文字:更好地发挥工人阶级主力军的作用, 770 91.0 98.0 77.8 识别结果:更好地发挥工人阵级主力军钓诈同· 2 1533 91.7 98.5 81.9 97.0 综合结果:更好地发挥工人阶级主力军的作用, 3 2855 90.3 69.1 4 1511 89.9 97.8 78.2 9)输入文字:要广泛宣传具有鲜明时代特征的 5 1511 96.1 98.6 64.1 艰苦创业先进典型. 6 1522 94.6 98.6 74.1 识别结果:要广沧室传具有鲜明时伐特征的艰 平均 92.2 98.1 74.2 芳创业先迭典形 部分单字识别结果与系统的综合处理结果对比 综合结果:要广泛宣传具有鲜明时代特征的艰 例句如下.其中:“输入文字”是手写汉字的内容; 苦创业先进典型, “识别结果”是单字汉字识别系统给出的识别结果; 10)输入文字:九十年代实现翻两番的第一步 “综合结果”是系统综合以后得到的结果.有下划线 战略目标。 的汉字为误识字 识别结果:丸十年代卖观翻两番的第一步战暗 1)输入文字:两国领导人为两国关系的现状感 目称 到满意 综合结果:九十年代实现翻两番的第一步战略 识别结果:两目颁导人讨西国类系约现状礁到 目标 涡意. 11)输入文字:是保证中心组学习活动的重要 综合结果:两国领导人为两国关系的现状熬到 条件 满意. 识别结果:是俘证中心狙学习玲劫钩重要条件. 2)输人文字:在会谈中 综合结果:是保证中心组学习活动的重要案件。 识别结果:札会误于 从以上例句可以看出,系统具有非常强的综合 综合结果:在会谈中 校正能力,大多数识别错误经多Agent综合处理后, 3)输入文字:他表示愿为保持和发展两国的友 得以校正.有时连续出现的误字,也能被改正,如在 好合作关系作出自己的贡献. 例句3、48、11中,出现了连续3个以上的误字同时 识别结果:他先示叁杠探拱和发在丙国的辰好 被更正的情况, 言作关系作出自已封贡献. 系统的误识主要是候选不足造成的.如例句1 综合结果:他表示愿为保持和发展两国的展的 中“感到满意”的“感”字,例句3中“自己的贡献”中 合作关系作出自己时贡献. 的“的”字等均未进入候选.同样在例句3中“友好 4)输入文字:是建设有中国特色社会主义伟大 合作”部分,由于“友”字未入候选,从而株连到“好” 事业的主力军。 字,正字也变误字了.这种现象称为“误校”.误校的 识别结果:是建设有中国特邑社余立叉伟大事 另一个原因是后处理的能力不足造成的.如在例句 业的主力军 11中,“重要条件”是正确的,被误校为“重要案 综合结果:是建设有中国特色社会主义伟大事 件”.其原因是,按照Markov模型,“重要案件”的连 业的主力军 接概率大于“重要条件”的连接概率,而“条”与 5)输入文字:社会稳定了我们才能集中精力做 “案”字又比较相近,识别Agent容易做出退让. 好各项工作 5结束语 识别结果:社会稳定了我们才能菜中精才做好 务项工作 本文引入Agent的概念,提出了一个基于多A 综合结果:社会稳定了我们才能集中精力做好 et系统的手写体汉字识别类市场模型.该模型改 合项工作 变了以往的“切分—识别—后处理”的串行处
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有