·220· 智能系统学报 第3卷 都放在了相邻近的位置上.图6中显示了训练学习 汉字字形认知过程中自组织分类学习的认知心理学 100次、180次、270次、330次的汉字的聚类结果.通 特征:而且从图5和图6中可以发现随着学习次数的 过汉字聚类结果的实验,可以得出以下结论:汉字聚 增加,模型的汉字聚类效果也增强,并逐渐趋于稳定 类与部件拆分模型训练过程可以体现自组织聚类现 这也大致符合汉字认知过程中随着学习量的增加掌 象,具有相似特征的汉字和部件分布比较接近,这种 握的知识量和知识结构趋于稳定的现象. 聚类结果是网络算法拓扑性质的体现,同时表现出在 净 面备 (a)学习100次 (b)学习180次 (c)学习270次 (d)学习330次 图6汉字的聚类动态过程部分) Fig 6 The dynam ic process of Chinese characters clustering 此外,研究工作还包括部件拆分汉字的部件 络 组成的研究,也得到了一些结果.汉字聚类层与部 k回7 件拆分层之间的关系,表示某个汉字由哪几个部件 组成,如图7所示.在批注中显示出这个单元格对应 嘈 激活的另外一层中的单元格的结果.图中显示出 软 “呵字的部件“口a7”、丁b6”、“口al”部件后面 盎 岗 的字母及数字组合表示的是该部件在不同汉字中的 织 不同位置信息.部件拆分层与汉字聚类层也有相似 的连接关系,表示的是某个部件对应其激活了的那 图7汉字聚类层与部件拆分层连接关系图部分) 些汉字,如图8所示.由所得到的结果,可以总结汉 Fig 7 The connection relation of Chinese charac- 字拆分成部件的学习效果,并可以归纳出2种情况: ters clustering layer and components split- 1)网络的汉字学习结果是完全正确的.如” ting layer 呵字的激活部件是“口a7”、丁b6”、“口al”,部 黑a7 末a7 件层的激活神经元所代表的部件与汉字的实际部件 7 拆分结果相吻合。 千b7 a7 2)网络的汉字学习结果是不完全正确的.而这 b7 种情况下,又分为部件混淆和部件冗余2种出错类 广7 a6 型.部件混淆是指部件层激活的部件序列中,部件数 又c a7 目与实际相符,但是存在一个或几个部件与相应的 又b4 b71刀a7刀b2 实际部件不符.例如唤"字的激活部件中的“厂b1” 图8部件拆分层与汉字聚类层连接关系图部分) 和“na5”,在实际序列中找不到完全吻合的部件 Fig 8 The relation connection of components split- 但是可以找到与之形似的部件“厂a5和“门a6”部 ting layer and Chinese characters clustering 件冗余则是指激活的部件多于实际部件数目,如 layer 柴字,在学习结果中,除了正确激活的“匕2” 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net都放在了相邻近的位置上. 图 6中显示了训练学习 100次、180次、270次、330次的汉字的聚类结果. 通 过汉字聚类结果的实验,可以得出以下结论:汉字聚 类与部件拆分模型训练过程可以体现自组织聚类现 象,具有相似特征的汉字和部件分布比较接近,这种 聚类结果是网络算法拓扑性质的体现 ,同时表现出在 汉字字形认知过程中自组织分类学习的认知心理学 特征;而且从图 5和图 6中可以发现随着学习次数的 增加,模型的汉字聚类效果也增强,并逐渐趋于稳定 , 这也大致符合汉字认知过程中随着学习量的增加掌 握的知识量和知识结构趋于稳定的现象. 图 6 汉字的聚类动态过程 (部分 ) Fig. 6 The dynamic p rocess of Chinese characters clustering 此外 ,研究工作还包括部件拆分 (汉字的部件 组成 )的研究 ,也得到了一些结果. 汉字聚类层与部 件拆分层之间的关系 ,表示某个汉字由哪几个部件 组成 ,如图 7所示. 在批注中显示出这个单元格对应 激活的另外一层中的单元格的结果. 图中显示出 “呵 ”字的部件“口 a7”、“丁 b6”、“口 a1”,部件后面 的字母及数字组合表示的是该部件在不同汉字中的 不同位置信息. 部件拆分层与汉字聚类层也有相似 的连接关系 ,表示的是某个部件对应其激活了的那 些汉字 ,如图 8所示. 由所得到的结果 ,可以总结汉 字拆分成部件的学习效果 ,并可以归纳出 2种情况 : 1) 网络的汉字学习结果是完全正确的. 如 " 呵 "字的激活部件是“口 a7”、“丁 b6”、“口 a1”,部 件层的激活神经元所代表的部件与汉字的实际部件 拆分结果相吻合. 2) 网络的汉字学习结果是不完全正确的. 而这 种情况下 ,又分为部件混淆和部件冗余 2种出错类 型. 部件混淆是指部件层激活的部件序列中 ,部件数 目与实际相符 ,但是存在一个或几个部件与相应的 实际部件不符. 例如 "唤 "字的激活部件中的“ㄏb1” 和“ㄇa5”,在实际序列中找不到完全吻合的部件 , 但是可以找到与之形似的部件“ㄏa5”和“ㄇa6”. 部 件冗余则是指激活的部件多于实际部件数目 , 如 “柴 ”字 , 在学习结果中 , 除了正确激活的“匕 b2” 图 7 汉字聚类层与部件拆分层连接关系图 (部分 ) Fig. 7 The connection relation of Chinese charac2 ters clustering layer and components sp lit2 ting layer 图 8 部件拆分层与汉字聚类层连接关系图 (部分 ) Fig. 8 The relation connection of components sp lit2 ting layer and Chinese characters clustering layer · 022 · 智 能 系 统 学 报 第 3卷