·386 智能系统学报 第5卷 模型代替整字,模型的复杂度降低:其次,部首的结 不再进一步分解.图1给出了一些结构模型 构比字符简单,识别精度能进一步提高;再者,部首 的类别数较小,相应所需的训练样本也少 联机手写汉字识别方法可以分为统计方法和结 构方法2大类.统计方法通常用特征向量表示整个 (愆 字符形状信息,用统计分类器进行字符分类.这种特 征向量表示法,如方向密度特征或方向直方图特 征6),能够容忍笔划顺序和笔划数的变化.统计方 法的识别精度较高,但由于字符的类别数很大,分类 (魔) (衢) (晰) 器参数的存储量也很大,训练样本也要求比较多.结 图1部分结构模型图 构方法通常基于笔划和部首的分析.为了容忍笔划 Fig.1 A part of structure models 顺序的变动,用笔划或子笔划基元以及它们之间的 部首类别的定义与部首的分割和识别密切相 关系来表示字符或部首模型.隐马尔可夫模型(hid- 关.利用字符的层次结构,采用不同的分割方法,最 den Markov models,HMMs)也经常用来表示笔划和 终所确定的部首类别会不同.图2给出字符“陛”的 部首模型?8),并且可以用判别学习方法来提高基 2种分割.图2(a)表示字符模型,图2(b)显示在1 于HMM的部首识别正确率).然而,由于HMM依 层水平方向分割得到的部首,图2(©)给出用3层嵌 赖于笔划顺序,每一个笔划或字符需要多个模型来 套分割得到的部首.对4284类左右结构字符进行 容忍笔顺的变化, 部首类别的统计,采用以上2种分割方法(如图2 基于部首的手写汉字识别方法的主要困难在于 (b)~(c))得到的部首类别数分别是1118和913 部首难以准确地从字符中分离出来.一些基于规则 类.本文采用后一种方法对字符进行分割,同时给出 的方法利用字符结构和部首位置的先验知识检测部 2种分割方法的实验结果比较 首o,然而并不适用于变形较大的字符.基于部首 和级联HMM的表示中,部首由笔划序列组成,能够 动态地与部首模型进行匹配[8],然而这种方法不能 容忍笔划顺序的变化.一种神经网络方法进行部首 (a)字符模型 (h)1层水平分割(c)3层嵌套分割 定位检测和特定位置的部首分类,不需要提取部 首[,但是这种方法需要大量的特定位置的部首模 图22种不同部首组成 型,而且部首分类的精度较差. Fig.2 Two different radical composition schemes 为了克服部首分割的困难,本文提出一种新的 基于部首的联机手写汉字识别方法,该方法结合了 给定所有字符类的训练样本,共享的部首模型通 统计方法和基于部首的结构方法的优点.这种方法 过两阶段自学习获得.首先,通过人工交互,每个字符 的思想类似于字符串识别中的字符切分2],只有同 类都有一个被正确分割的部首序列,然后借助动态规 时进行部首形状识别才能准确地分割部首.这种方 划(dynamic programming,DP),该类的剩余样本和所 法已在文献[13-14]中表明了其在左右与上下结构 得到的正确部首序列进行匹配,从而得到该字符类的 字符中的有效性.本文从该方法的基本思想、系统框 所有部首样本.图3给出了通过DP得到的一类字符 架和具体技术进行展开。 的部首样本,对一类字符类中的每类部首(如图3中 的“日”、“立”),用该类样本的特征均值表示每类部 1 部首模型的创建 首的模板.然后,对得到的所有字符类的部首模板进 大量的汉字是由共用的子结构(部首)组成.由 行层次聚类得到共享的部首模型,通过聚类,不同字 于部首的类别数比字符少,而且结构简单,用部首作 符中的相同部首被自动合并,如“阿”、“阶”、“陈”等 为分类基元会带来益处.为了识别字符,用层次性结 字符中的抱耳旁被合并为一类, 构表示部首模型,并引导部首的分割.这种模型驱动 采用基于合并的层次聚类方法.一开始,所有字 的识别方法有助于克服字符形状变化和笔划连接所 符类所包含的每类部首模板是一个独立的类,然后 导致的部首分割困难的问题, 每次将最接近(类中心的欧氏距离)的2个部首类 汉字字符具有层次性结构,如左右结构的字符 进行合并,直到满足终止条件为止,终止时的聚类个 中嵌套上下结构,子结构(上下结构)中有可能进 数作为最终的共享部首模型的数目.为了确定合适 步嵌套左右结构.假定最多有3层嵌套,多于3层的 的聚类数,通过人工监控聚类过程决定终止条件