机器感知与模式识别：基于多Agent系统的脱机手写体汉字识别

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：601.4KB

第4卷第5期智能系统学报 VoL.4 No.5 2009年10月 CAAI Transactions on Intelligent Systems 0ct.2009 doi:10.3969/j.i8sn.16734785.2009.05.003 基于多Agent系统的脱机手写体汉字识别马少平12,3，金奕江123 (1.清华大学计算机科学与技术系，北京100084；2.清华大学智能技术与系统国家重点实验室，北京100084：3.清华大学清华信息科学与技术国家实验室（筹），北京100084) 摘要：由于脱机手写体汉字的多样性和随意性，识别起来具有很大的难度，依靠单一的特征很难实现高准确率的识别.引人多Agent的概念，将多种知识统一于多Agent系统之中，给出了一个面向脱机手写体汉字识别的多Aget 类市场模型，提出了一种模糊综合方法和辩论协商规侧，实现了一个基于多Agt系统的脱机手写体汉字识别系统. 初步测试结果显示出系统的有效性。关键词：汉字识别；多Aget系统；类市场模型；模糊综合；辩论协商规侧中图分类号：T391.4文献标识码：A文章编号：16734785(2009)05039808 Offline recognition of hand-written Chinese characters based on a multi-Agent system MA Shao-ping,JIN Yi-jiang (1.Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China;2.State Key Lab of Intelligent Technology and Systems,Tsinghua University,Beijing 100084,China;3.Tsinghua National Laboratory of Information Science and Technology,Tsinghua University,Beijing 100084,China) Abstract:Due to the diversity and randomness of Chinese characters,it is difficult for offline hand-written Chinese character recognition to perform well when based solely on analysis of a single feature.In order to solve this prob- lem,a multi-Agent based recognition method was proposed.It merges a variety of knowledge into a market-like model.A comprehensive approach using fuzzy rules to provide consultation and debate rules between Agents was al- so incorporated.With this proposed method,a multi-Agent offline hand-written Chinese character recognition sys- tem was constructed.Preliminary experimental results showed the effectiveness of this system. Keywords:hand-written chinese character;multi-Agent system;market-like model;fuzzy synthetic;debate-nego- tiation rules 从1966年BM公司首次发表关于汉字识别的法3)，以弥补单一特征、单一分类器的不足.在印刷研究文章以来，汉字识别的研究已经有40多年的历体汉字和手写体数字识别中，已成功地开发出系统史.在这期间，无论是在汉字特征的描述山、抽取方集成识别系统，取得了良好的效果，不仅降低了系统法，还是在分类器的构造方法上，均取得了很大进的误识率，也使得系统的整体识别率达到了任何参展，尤其是在印刷体汉字识别和联机手写体汉字识与集成的单一系统所达不到的水平[45]」别方面，已开发出一批实用的系统[.同时人们也在现有的系统集成方法中，几乎无一例外地是清醒地认识到，任何特征和分类器都有其局限性，使多种识别器间的集成，这种方法在现有条件下，对脱用单一的特征、单一的分类方法，很难使识别性能在机手写体汉字识别来说存在较大的困难，以及不全现有的基础之上再上一个新的台阶.为此，人们又提面性和不合理性.在多识别器集成系统中，无论是采出了综合使用不同的特征和分类器的系统集成方用简单的投票表决方法，还是用各种不同的基于概率的决策模型，均要求各分类器及所用特征间具有收稿日期：200909-21. 独立性，这样才能使得决策结果具有公正性.而目前基金项目：国家自然科学基金创新研究群体科学基金资助项目 (60621062). 较为有效的脱机手写体汉字识别方法中，虽然各有通信作者：马少平.E-mail:msp@tsinghua.ed血.cm. 特色，但几乎全部是以方向线素特征[]为基础的

第5期马少平，等：基于多Aget系统的脱机手写体汉字识别 ·399· 不能满足多识别器合成的独立性要求。求其他Agent的帮助.这样一来，Agent在担当生产手写汉字随意性较大，单靠特征很难正确地识者的同时，有时也充当消费者的角色。别手写相近字，在印刷体中一些明显的差别，对于手结果用户处理结果与请求管理者写体来说也变地不那么可靠了.因此，单纯用多识别任务器集成来识别手写汉字，既不全面，也不尽合理，应使用除特征以外的更多的知识，进行综合判断.而在 Agent 1 环实际应用中，多是以文本为识别单位，这为综合利用信息 Agent 2 多种知识提供了条件.后处理方法就是在这种情况下应运而生的]. Agent 以往脱机手写体汉字识别模型的一个重要特点是其串行性，后处理引起的任何错误都将被保存下来，相对于识别来说，后处理具有权威性.而后处理图1汉字识别类市场模型的知识不可能是完备的，由于其权威地位，因此知识 Fig.1 A market-like model for Chinese character recognition 不足造成的错误得不到更正的机会.一种合理的想系统的基本工作过程如下：法是各种求解方法，无论是识别、后处理，还是其他 1)用户向系统提交任务，任务中包括识别对象方法，均处于一个平等的地位.不同的方法之间，通和要求等信息；过协商、交流，达到总体上的和谐和最好的识别效 2)管理者根据用户提交的任务，按用户的需求果.多Agent系统正好具备这方面的特点[).本文规划任务求解，形成招标信息公布于环境中；引人Agent的概念，针对手写体汉字识别的特点，给 3)Agent感知到招标信息后，根据自己的求解出了一个基于多Agent系统的汉字识别模型，提出能力及资源消耗，产生一种或几种投标方案，形成标了一种模糊综合评判方法，以及各Agent间的协商书，送交管理者；辩论方法 4)管理者根据投标情况选择中标者，并规划任务求解，通过环境将中标信息分发给相应的Aget; 1基于多Agent的汉字识别类市场模型 5)Agent在得到中标信息后，按中标合同组织类市场模型是多Agent系统中的一个重要模问题的求解，将结果送交管理者，在结果中也可能包型，受到学者们越来越多的重视.根据计算生态学的含新的任务请求；研究发现，在所有生态系统中，市场结构最为完善， 6)管理者对各个Agent的求解结果进行分析，具有最高的智能.根据手写体汉字识别的特点，借用若有新的任务请求，则组织招标，重复3~5)，否则市场模型的概念，给出基于多Agent系统的手写体将结果进行组织后公布在环境中；汉字识别模型如图1所示.其中环境用于存放各种 7)在所有任务求解完成之后，仲裁Agent对识任务请求、处理所需的原始信息、处理的中间结果及别结果进行仲裁，当存在矛盾冲突时，由管理者组织其各Agent间的通讯信息等.管理者负责组织和规相关Agent进行辩论协商，直到达成一致解或最大划任务求解以及环境中的信息管理.Agent从环境可能解；中感知信息，利用自己的能力对其进行处理，并将处 8)最终由管理者将识别结果输出给用户，理结果通过管理者有组织地对环境进行更新.在该 2模型的详细说明模型中，用户相当于消费者，向系统提出任务请求并接收系统的处理结果.管理者起中间商的作用，对欲 2.1任务求解的任务组织招标，规划中标者的任务求解，当出任务有2种类型，一种是由用户提交的任务，称现矛盾冲突时，组织相关的Aget进行辩论和协商，为用户任务，它指定了系统的最终求解目标另一种以寻求一个可以接受的一致解.Agent相当于生产是由系统内部产生的任务，称为系统任务.管理者根者，时刻监视环境中的信息，一旦发现自己可以胜任据用户任务的不同目标，规划求解路径，路径中的每的任务，则根据自己的能力进行投标，一旦中标后，一个求解目标均产生至少一个系统任务.当Aget 立即进行求解.除了用户提供的任务请求外，每个在求解过程中请求其他的Agent支援或需要与别的 Agent也可以根据自己的需求提出任务请求，以寻 Aget对话时，生成系统任务.当发生矛盾冲突需要

·400 智能系统学报第4卷进行辩论协商时，管理者也生成系统任务的存储格式为数组.最基本的可操作单位为特征分一个任务具有如下的格式：量.一个汉字样本，可以对应多组特征. ( 4)单字层.识别器基于特征的识别结果，连同其 []). 候选字、识别信度存放于该层.基本的存储格式为一其中，是任务标识，由系统自动分结构，该结构含有2个关键域，一个域为按信度大小配，任务名可以惟一地表示出一个任务；给顺序存放的候选字，另一个域为候选字所对应的信出该任务的操作对象，如一个切分任务，其对象可以度，2个域均为数组.该层最基本可操作单位为字是一个TF或BMP文件，而一个识别任务，其对象 5)词汇层.利用词汇知识对单字识别结果（包则可以是已切分好的汉字图像点阵等；指括候选)进行评判，评判结果存放于该层.基本的存定了的类型，如TF_FLE、BMP_FLE等；储格式为含有2个关键域的结构，一个域记录候选给出该任务对给定对象最终求解到什么程字的构词情况，另一个域记录评判信度.该层的最基度，如对于一个T亚文件对象，是只给出切分结果本可操作单位为词，包括单字词和多字词. (因为用户可能并不要求识别)就行了呢，还是要对 6)短语层.对各候选可能形成的短语或句子，其进行识别，如果是识别是否进行后处理等等；是一个可选参数，如果需要或者可能的话，它指该层.基本的存储格式是一个复杂的多级链表结构，定出所在的领域.领域既可以标识出识别实际上表达的是一个搜索图.该层的基本可操作单对象是汉字、数字还是英文等信息，又可以给出待处位为短语或句子理的对象属于社会科学范围，还是属于计算机科学 7)结果层.该层记录系统最终的识别结果，基范围等信息，供与领域有关的Agent使用，本的存储格式同单字层一样为一结构，该结构含有 2.2环境 2个关键域，一个域为按综合评判信度大小顺序存环境由一个公告牌和一个分层结构的黑板组放的候选字，另一个域为候选字所对应的信度，2个成.用户提供的原始信息、招标投标信息、各Aget 域均为数组. 的处理结果及相互间的交互信息等均存放于环境之 2.3管理者中.环境对于每个Agent是共享的. 管理者可以看作是一个特殊的Agent,它具有公告牌是各种消息的集合.管理者与Agent之多重身份.其一，管理者是一个中间商，它对用户或间、Agent与Agent之间的各种通讯与交互均通过公其他Agent提交的任务，规划求解路径，分解为若干告牌进行个子任务，发布于公告牌上，组织招标.在接收到A 黑板是问题的解空间以层次结构方式组织起来 get的标书后，根据任务的具体要求，从求解精度、的全局数据库，是所有公有信息的集合，Agent使用时间消耗和资源消耗等几个方面选择中标者.对于的所有数据均存放于黑板之中.一个黑板被划分为同一个求解目标，中标者可以是一个，也可以是多以下7个层次：个.为发挥更多的Agent的作用，在时间允许的情况 1)版面层.这是由扫描仪扫描汉字样张得到的下，管理者尽可能多地选择中标者.其二，管理者实最原始黑白二值图像，存储格式为F文件格式或现对环境的管理.所有的任务请求，均通过管理者张 BMP文件格式.最基本的可操作单位为图像的贴于公告牌上，所有处理结果，也要经过管理者组织 “点”.该层内容简称为版面，之后放置于环境之中.其三，管理者是一个调节人， 2)样本层.对版面进行分析后，经行切分、字切当发生矛盾冲突时，管理者负责组织各相关Agent 分后，得到单个汉字的点阵及其结构属性信息（如间的辩论与协调，听取各辩论者的意见，使得在各上下结构、左右结构、内外结构等)存放于该层.对 Aget间最终达成一个一致的意见或可能性最大的汉字点阵进行噪声处理、光滑处理、规格化等预处理结果的结果也放于该层之中.汉字点阵基本的存储格式 2.4 Agent 为二维矩阵，最基本的可操作单位为“点”.该层内 Agent由感知器、发送器、任务分配器、知识库、容简称为样本，方法集和局部黑板6部分组成，其一般结构如图2 3)特征层.对汉字样本抽取出的识别特征存放所示.其中感知器用于感知环境中的信息，它时刻监于特征层，一个汉字的特征为一个N维向量，基本视着环境的变化，随时捕捉与自己相关的信息.任务

第5期马少平，等：基于多Aget系统的脱机手写体汉字识别 ·401· 分配器根据感知到的信息，分发给适合的方法.方法局部黑板是Agent的私有数据库，用于存储求解问集是该Aget能力的体现，与知识库相配合，实现对题所需的各种数据、中间结果及最终结果等.发送器问题的求解.方法集至少由3部分内容组成：投标方将求解结果或任务请求发送给系统的管理者，以实法、问题求解方法和辩论协商方法.方法集和知识库现与环境或其他Agent的交互. 构成了Agent的大脑，是Agent最重要的组成部分，环境感知器局任务分配器部黑 !识市管理者发送器板方法集 Agent 图2 Agent的一般结构 Fig.2 General structure for recognition Agent Agent根据其功能的不同，可以分为以下几类：别结果的手段。 1)扫描Aget:启动扫描仪，获得待识别文字的各类Agent与环境信息层的关系如图3所示，图像信息. 结果层校对 2)切分Agent:对版面进行分析，将版面中的每知层个汉字从图像中分离出来，得到待识字样本；必要词层后处理时，切分Agent也可以给出样本的结构信息，如左右单字层识别评价乳处理结构、上下结构等特征层识别 3)预处理Agent:消除样本中存在的噪声，对汉样木尽预处理特抽取字笔画边缘进行平滑处理，然后再对汉字样本进行版层 6切分非线性整形变换及大小归一化处理。 6扫描 4)特征抽取Agent:从归一化后的汉字样本中抽取识别用特征图3知识源与信息层的关系 5)识别Agent:对于不同的特征，采用不同的方 Fig.3 Relationship between knowledge sources and in- 法对待识样本进行分类，得到候选字及其识别参数。 formation layers 6)识别评价Agent:应用单字识别系统的误识 2.5仲裁模型及识别参数对候选字进行评价，得到候选字的对于脱机手写体汉字识别来说，各Agent的处识别信度. 理结果很难做到完全一致，当出现任何不一致时，系 7)词汇处理Aget:利用词汇知识对前后相关联的统就进行辩论协商，系统开销太大.一种可行的办法候选字进行构词分析，提出假设，并给出信度评价. 就是对结果进行模糊综合评判，当评判结果达到一 8)后处理Agent:对各候选可能形成的短语或定的可信度时，就认为该结果是一致的，否则被认为句子提出假设，利用汉语语言模型进行分析，给出信是有矛盾冲突的.只有在模糊评判意义下发生冲突度评价时才进行辩论协商。 9)仲裁Agent:对不同的Agent给出的结果，用 2.6协商与辩论某种评判方法进行综合评判，一致的部分确定下来，协商是多Agent系统中关键的组成部分12].若产生矛盾的部分，送交管理者组织辩论. 干个Aget简单地堆放在一起，永远是几个独立的 10)自动校对Aget:对识别结果中与语言模型个体，只有相互协调合作，才能使其综合能力具有质不相符的部分提出警告，提示给用户。的变化.辩论是协商的一种方式，通过辩论，使得各 11)人工校对Agent:提供一种便于用户校对识 Aget间取得一致的意见，也就是说，得到一个对于

·402 智能系统学报第4卷待识别样本可能性最大的识别结果. 在P部的特征进行识别时的识别器评价指标，辩论是一个说理的过程，每个参与辩论的A 规则5如果P1是相对于Agent1的C1、C2间 gent,从自己的立场出发，重新审视所讨论的问题，的最大差异部分，P2是相对于Agent2的C1、C2间的提出自己的理由和根据.通过协商，或者坚持自己的最大差异部分，P1≠P2,且当用P1替换P2时Aget2 原有观点，努力去说服其他的Agent同意自己的意支持Agent1的结论；则有理由相信Agentl的结论是见；或者被其他的Agent说服，改变自己的立场，支正确的. 持说服者的意见.下面给出一些辩论规则. 该规则反映了Agent在辩论中的退让，规则1如果C1是特定结构汉字，而C,是非特定规则6如果已经确认0为专有名词的一员，结构汉字，当当前待识别的汉字0与C1具有相同的特且选择C1后，专有名词词典中含有该名词；则有理定结构时；则有理由相信O为C1,而非C2 由相信0为C· 其中特定结构汉字指的是具有左右结构，或者上专有名词指人名、地名、公司名等，在一个句子下结构，或者内外结构的汉字中，具有明确上下文特征的专有名词可以通过判别 C1、C2的结构信息存放于Agent的知识库中，法则判定而O的结构信息在切分时获得，或者通过求解笔画规则7如果已经确认0为专有名词的一员，的连通域获得. 且选择C1或C2后，在专有名词词典中均不含有该注意该规则只规定了当O与C,具有相同的特名词；则识别类Agent的结果更为可靠. 定结构时才确信O为C1,而0为非特定结构时，并规则8如果识别Agent对C,和C2的可信度不能确信0为C2·这是因为在手写体汉字中，习惯之差小于给定值，而且C,的组句能力与C2的组句性的连笔往往会破坏汉字的结构特征，能力之差大于给定值；则有理由相信O为C 规则2如果C1与C2的复杂度差大于给定值，其中C的组句能力定义为：当0固定为C时，经且0与C,的复杂度差小于给定值；则有理由相信O 后处理后O所在句子的概率.这也是一条退让规则，为C 反映了当识别Agent没有较大的把握区分出C,和其中汉字的复杂度可以用规格化后汉字点阵的 C2时，把决定权交由后处理Agent.. 黑白点之比来度量，也可以用汉字的纵向层次数或 3模糊综合评判横向层次数度量. 规则3如果0为汉语句子中的一员，且C1、C2 设x为待识汉字，C={c1,c2,…,cn}为其候选为一对客观相似字，则识别类Agent对此不参与辩集，A={a1,a2,…,an}为Agent集，每一个a从自论己的立场出发，对候选c:是否为x的识别结果有一将相似字定义为客观相似字和主观相似字] 个评价，经适当的转换后，该评价可以看作是从A 客观相似字指的是那些拓扑结构相似的汉字，而主到F(C)的模糊映射，即观相似字指的是那些拓扑结构并不太相似，但是特子：A+F(C), 征比较相似的汉字，这是由于特征抽取的不连续性 a→f(a）(ta,r2,…,m)∈F(C). 造成的。式中：F(C)表示定义域为C的模糊集合的全体客观相似字虽然它们的拓扑结构非常相似，但由于各Agent所采用的知识不同，其对c:评判字意一般有很大的差别，如“士”和“土”、“末”和的精确程度和重要程度也不同，因此对不同的A “未”等.与其通过识别Agent找出它们在字形上的 gent给出的评判，要分别对待，有一定的权重分配. 差别，不如通过后处理等手段进行选择更为可靠. 权重分配可以看作是A上的模糊集，记为规则4如果P是使C1、C2产生最大差异的部 W=(01,02,…,0m）∈F(A). 分，且在相同的部分0与C1的差异小于0与C2的差式中：切，表示第j个Agent的权重，它们满足归一化异；则有理由相信0为C· 条件：其中，P为汉字的左半部、右半部、上半部、下半部、中心部或外围部之一，差异指的是当只使用包含

第5期马少平，等：基于多Aget系统的脱机手写体汉字识别 ·403· 对各候选综合评判的结果，可视为C上的模糊 Zadeh算子强调单个Agent的作用，当有一个集，记为 Aget对某个候选表现出很强的可信度时，就将该 B=(b1,b2,…,bn)∈F(C) 候选作为评判结果.而概率算子则考虑了更综合的式中：b:反映了综合评判后，待识字x被识别为c: 情况，具有一定的加权平均的意义的可能程度，由于各Agent对候选的评判是基于统计知识进由模糊映射与模糊关系的关系及模糊关系与模行的，同时又存在着“数据稀疏”问题，所以这种评糊变换的关系，模糊映射了可以惟一地诱导出模糊判带有很大的先验性和不准确性；因此在评判时采关系：用具有加权平均意义的概率算子比用主元素决定的「f（41)1 T12 …T11 Zadeh算子要好一些，经实际测试也证明了这一点. f(u2） T21 T22 T2n 而且这与多Agent系统发挥各Agent的综合优势也 R△R△ ∈Mmn 是相吻合的， L孔u）打 LTml Tm2 4系统测试式中：Mmxn为m×n矩阵的全体由R又可以惟一地诱导出一个模糊变换：以上文所述模型为基础，实现了一个基于多A TR:F(A)→F(C), gent的手写体文本汉字识别系统，对系统的性能进行了测试.为了更好地体现多Aget的作用，特意选 W→Ta(W)△WR. 取了一个早期的识别率相对比较低的脱机手写体汉这样，由三元组(A,C,R)构成了一个模糊综合评字单字识别系统，以体现多种知识融合的作用，判模型.当给定一个权重分配W=(01,02,…, 测试条件如下： 0nm)∈F(A)后，则输出一个模糊综合评判B=WoR= 1)训练样本：中科院自动化所样本库，共含国 (b1,b2,…,bn)∈F(C),于是有标一级汉字50套； (b2,b2,…,bn）=(01,02,…,0m） 2)汉语语料库：《人民日报》语料库，共含汉字 T11T12 TIn 1500万个； 3)识别库大小：1.9MB; T2 T22 Iin 4)后处理库大小：4.5MB; 5)文章内容：从《人民日报》、《新清华》上选取 LTml Tm2 T 的5篇文章，每篇文章的字数从770字到2855字如果bn=max{b1,b2,…,bn},则评判co为x的识别不等；结果.式中算子“。”可取Zadeh算子（∧，V)、概率 6)书写对象：随机选取的6位书写者；算子(·，+)或其他模糊算子.采用不同的算子，所 7)书写要求：按自己习惯工整手写. 强调的内容不同，评判的结果也有所不同，采用以下指标测试系统的性能：当采用Zadeh算子时，单字识别率-单字识别确字数×100%，总字数 6=(aAg,j=1,2,…,n 综合识别率=综合正确字数×100%，式中：总字数 x∧y=min(x,y）), 综合校正率= x Vy =max(x,y). 综合正确字数-单字识别正确字数×100%. 总字数·单字识别正确字数当采用概率算子时，式中：“单字识别正确字数”指的是只采用识别Agent b,=01·Ty+02·Ty+…+0m·T网，时，系统能正确识别的汉字数；“综合正确字数”指的是 j=1,2,…,n 采用多Aget之后，系统总的正确识别的汉字数，式中：综合校正率是反映多Agent汉字识别系统性能 x·y=xXy, 的一个重要指标，它反映了采用多Agent之后系统 x +y =x +y-x x y. 误识率的下降程度」

·404 智能系统学报第4卷测试结果如表1所示，从表中可以看出，系统的 6)输人文字：我自然是不赞成的，平均单字识别率为92.2%，而综合识别率平均达到识别结果：战自然足不赞或的，了98.1%，提高近6%，综合校正率平均为74.2%. 综合结果：我自然是不赞成的，表1文本识别实验结果 7)输入文字：亿万农民解放思想更新观念 Table 1 Experimental results on character recognition 识别结果：亿万农民解放怠想更新观念单字综合综合结果：亿万农民解放思想更新观念书写者字数综合识别率/% 识别率/% 校正率/% 8)输入文字：更好地发挥工人阶级主力军的作用， 770 91.0 98.0 77.8 识别结果：更好地发挥工人阵级主力军钓诈同· 2 1533 91.7 98.5 81.9 97.0 综合结果：更好地发挥工人阶级主力军的作用， 3 2855 90.3 69.1 4 1511 89.9 97.8 78.2 9)输入文字：要广泛宣传具有鲜明时代特征的 5 1511 96.1 98.6 64.1 艰苦创业先进典型. 6 1522 94.6 98.6 74.1 识别结果：要广沧室传具有鲜明时伐特征的艰平均 92.2 98.1 74.2 芳创业先迭典形部分单字识别结果与系统的综合处理结果对比综合结果：要广泛宣传具有鲜明时代特征的艰例句如下.其中：“输入文字”是手写汉字的内容；苦创业先进典型， “识别结果”是单字汉字识别系统给出的识别结果； 10)输入文字：九十年代实现翻两番的第一步 “综合结果”是系统综合以后得到的结果.有下划线战略目标。的汉字为误识字识别结果：丸十年代卖观翻两番的第一步战暗 1)输入文字：两国领导人为两国关系的现状感目称到满意综合结果：九十年代实现翻两番的第一步战略识别结果：两目颁导人讨西国类系约现状礁到目标涡意. 11)输入文字：是保证中心组学习活动的重要综合结果：两国领导人为两国关系的现状熬到条件满意. 识别结果：是俘证中心狙学习玲劫钩重要条件. 2)输人文字：在会谈中综合结果：是保证中心组学习活动的重要案件。识别结果：札会误于从以上例句可以看出，系统具有非常强的综合综合结果：在会谈中校正能力，大多数识别错误经多Agent综合处理后， 3)输入文字：他表示愿为保持和发展两国的友得以校正.有时连续出现的误字，也能被改正，如在好合作关系作出自己的贡献. 例句3、48、11中，出现了连续3个以上的误字同时识别结果：他先示叁杠探拱和发在丙国的辰好被更正的情况，言作关系作出自已封贡献. 系统的误识主要是候选不足造成的.如例句1 综合结果：他表示愿为保持和发展两国的展的中“感到满意”的“感”字，例句3中“自己的贡献”中合作关系作出自己时贡献. 的“的”字等均未进入候选.同样在例句3中“友好 4)输入文字：是建设有中国特色社会主义伟大合作”部分，由于“友”字未入候选，从而株连到“好” 事业的主力军。字，正字也变误字了.这种现象称为“误校”.误校的识别结果：是建设有中国特邑社余立叉伟大事另一个原因是后处理的能力不足造成的.如在例句业的主力军 11中，“重要条件”是正确的，被误校为“重要案综合结果：是建设有中国特色社会主义伟大事件”.其原因是，按照Markov模型，“重要案件”的连业的主力军接概率大于“重要条件”的连接概率，而“条”与 5)输入文字：社会稳定了我们才能集中精力做 “案”字又比较相近，识别Agent容易做出退让. 好各项工作 5结束语识别结果：社会稳定了我们才能菜中精才做好务项工作本文引入Agent的概念，提出了一个基于多A 综合结果：社会稳定了我们才能集中精力做好 et系统的手写体汉字识别类市场模型.该模型改合项工作变了以往的“切分—识别—后处理”的串行处

第5期马少平，等：基于多Aget系统的脱机手写体汉字识别 ·405· 理机制，各Agent处于同等的处理地位，每个Agent (2):172-178. 从各自的立场出发，提出自己的处理意见，通过模糊 XIA Ying,MA Shaoping,CHANG Xingong,et al.The 综合评判，给出一个模糊评判意义下的最优结果.当 method of automatic post-processing based statistical proba- 综合评判不能确定结果时，采用辩论的方法，协调各 bilities for Chinese recognition text[J].Pattern Recognition Agent的意见，通过Agent间的协商，得到一个大多 and Artificial Intelligence,1996,9(2):172-178. [8]RUSSELL S,NORVING P.人工智能一一种现代方法数Agent都能接受的识别结果，任何一个Agent都 [M].姜哲，金奕江，张敏，等，译.2版.北京：人民不处于绝对权威的地位，充分发挥了每个Agent自邮电出版社，2004：2642. 身的决策能力，从而极大地减少了串行机制中，每一 [9]LIU Jiming.多智能体原理与技术[M].靳小龙，张世个局部的处理错误都将导致最终错误的不合理现象武，LIU Jiming,译.北京：清华大学出版社，2003：1-17，的发生.该模型通过招标投标的形式求解问题，具有 43-64. 一定程度上的开放性.组成系统的Agent的数量及 [10]HUYNH T D,JENNINGS N R,SHOADBOLT N R.An 功能均可以动态决定，系统随时可以加入新的A integrated trust and reputation model for open multi-Agent gent参与任务求解.从原理上讲，该模型具有分布处 systems[J].Autonomous Agents and Multi-Agent Sys- 理能力，各Agent既可以集中在一台处理器上，也可 tems,2006,13(2):119-154. 以分布在不同的处理器上，为进一步的网络计算打 [11]PANAIT L,LUKE S.Cooperative multi-Agent learning: the state of the art[].Autonomous Agents and Multi-A- 下了基础. gent Systems,2005,11(3):387-434. 参考文献： [12]王立春，陈世福.多Aget多问题协商模型[J].软件学报，2002,13(8)：1637-1643. [1]陈静，穆志纯，孙筱情。计算机模拟汉字字形认知过程 WANG Lichun,CHEN Shifu.A multi-Agent multi-issue 的研究[J].智能系统学报，2008,3(3)：216-221. negotiation model[J].Journal of Software,2002,13(8): CHEN Jing,MU Zhichun,SUN Xiaoqgian.Computer simu- 1637-1643. lation of the cognition of Chinese characters[J].CAAI [13]张德喜，马少平，朱绍文，等.基于统计与神经元方法相 Transactions on Intelligent Systems,2008,3(3):216-221. 结合的手写体相似字识别[J].中文信息学报，1999， [2]张忻中.汉字识别技术[M].北京：清华大学出版社， 13(3):33-39 1992:3141,125-160 ZHANG Dexi,MA Shaoping,ZHU Shaowen,et al.Hand- [3]DU Qingdong,LIU Jie.A new neural fusion recognition written similar Chinese characters recognition based on method with multi-Agent[C]//Proceedings of the Third In- combining statistics with neural networks method[J].Jour- ternational Conference on International Information Hiding nal of Chinese Information Processing,1999,13(3):33- and Multimedia Signal Processing (IIH-MSP 2007).Wash- 39 ington DC:IEEE Computer Society,2007:127-130. 作者简介： [4 ]ZHU Xiaoyan.Multiple neural networks model and its appli- 马少平，男，1961年生，教授，博 cation in pattern recognition[C]//IEEE International Con- 士生导师，主要研究方向为智能信息处 ference on Neural Information Processing.Beijing,China, 理、信息检索、汉字识别与后处理以及 1995:966-969. 中文古籍数字化.承担过多项国家自然 [5]张永慧，刘昌平，罗公，等.技术综合集成在模式识别科学基金、“863”项目、“973”项目及国中的应用[J].计算机学报，1995,18(19)：678685，际合作项目，在脱机手写体汉字识别和 ZHANG Yonghui,LIU Changping,LUO Gong,et al.Inte- 后处理方面达到了国际先进水平，“脱机手写体汉字与数字 gration comprehensive techniques in pattern recognition[J] 识别系统”1998年1月获得国家教委科技进步二等奖.发表 Chinese Journal of Computers,1995,18(19):678-685. 学术论文70余篇，出版专著2部. [6]马少平，夏莹，朱小燕.基于模糊方向线素特征的手写体汉字识别[J].清华大学学报：自然科学版，1997,37 金奕江，男，1970年生，工程师，主 (3):4245. 要研究方向为汉字识别、信息检索与处 MA Shaoping,XIA Ying,ZHU Xiaoyan.Handwritten Chi- 理.发表学术论文10余篇。 nese characters recognizing based on fuzzy directional line element feature[J].Journal of Tsinghua University:Sci Tech,1997,37(3):4245. [7]夏莹，马少平，常新功，等.基于统计的汉字识别文本的自动后处理方法[J].模式识别与人工智能，1996,9

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录