第3期 陈静,等:计算机模拟汉字字形认知过程的研究 ·221- 外,还多出了“匕5这个部件.但是多出来的部件 [3王建勤.外因学生汉字构形意识发展的模拟研究—基 并不是同相应的汉字完全无关,它们总是与实际的 于自组织特征映射网络的汉字习得模型[D]北京:北京 部件有很大的相似度. 语言大学,2005 模型通过训练得到的这些结论与心理学研究中 WANG Jiangin Smulating studies of CFL leamers'Chinese 行为实验研究的结果相似,从不同的方面反映了汉 orthographic awareness development based on selforganizing 字字形认知过程中的某些规律,体现了汉字字形认 feature map nework[D ]Beijing Language and Culture U- niversity,2005. 知过程中的部分特点, [4邢红兵.小学语言教材形声字表音情况统计分析及小学生 4模型的测试 形声字命名的自组织模型[D]北京:北京师范大学,2002 XNG Hongbing Analysis of phonetics of semantic-phonetic 对训练好的模型进行测试,以输入生字来考察 compound characters in elementary school textbooks and a self 模型测试效果为例,取生字50个字,选用包括了左 organizing connectionist model of character acquisiton in Chi 右、上下、包围3个结构的字.测试结果如图9所示 nese[D].Beijing Language and Culture University,2002 图中阴影中的字为测试字,可以看出网络能够根据 [5舒华,韩在住,许忠宝认知神经心理学的基本假设和 之前学到的知识对输入的生字进行推测识别,测试 研究方法[J].心理科学,2002(6):721-722 字根据与已学过汉字有相似的结构或部件信息放在 SHU Hua,HAN Zaizhu,XU Zhongbao The basal hypothe- 了这些汉字的附近,可以看出测试结果图中汉字的 ses and research methods in cognitive neuropsychobgy[J] 聚类效果仍然存在,例如将怅放在了张的附 Psychological Science,2002(6):721-722 [6边肇祺,张学工.模式识别[M]北京:清华大学出版社, 近,训放在了计的附近 2000:259 系 账 行 [7]KANAGAS J,KOHONEN T Devebpments and applications of 张芒芳 连过 补 迈迫 the selforganizingmap and related algprithms[J]Mathematics 建边 and Computers in Smulation,1996,41:3-12 计 双冈 [8 ]L I P,FARKAS I MACWH NNEY B.Early lexical devel- 竿 叫另扎 先此■ opment in a selforganizing neural nework[J ]Neural Net- w0ks2004(17):1345-1362 黄复 作者简介: 图9生字测试结果图部分) 陈静,女,1979年生,博士研究 Fig 9 Testing result of new Chinese character 生,主要研究方向为人工智能、模式识 别 5结束语 从模型模拟过程中可以看出,对模型进行训练 网络通过对汉字及其部件信息的学习,对汉字的构 穆志纯,男,1952年生,教授,博士 形方式、结构规则等都有了一定的认识,能够发现其 生导师,主要研究方向为人工智能及其 中的规律,在对学习的汉字进行其部件的拆分的同 应用、模式识别图像处理、生物特征识 时,还能将有相似结构或部件的汉字聚类,在一定程 别、复杂系统的建模与控制.1989~ 度上模拟了汉字字形的认知过程。 1991年和19971999年间在英国进行 参考文献 访问研究.曾主持、参加国家自然科学 基金项目4项、青年“863项目1项国家科技攻关和国际合 [1调志华,曹存根.神经网络及其应用[M]北京:清华大 作项目多项,并获部级科技进步二等奖1项、三等奖2项.己 学出版社,2004:366 发表论文90余篇,其中被S℃和E检索40余篇 [2唐一源,张武田,马林,翁旭初,李德军,何华,贾富 仓.默读汉字词的脑功能偏侧化成像研究[J]心理学 孙筱倩,女,1983年生,硕士研究 报,2002,34(4):333-337 生,主要研究方向为人工智能、模式识 TANG Yiyuan,ZHANG Wutian,MA L in,WENG Xuchu. 别 LIDejun,HE Hua,JA Fucang The laterality of brain function in silent reading of Chinese words revealed by FMR [J ]Acta Psychobgical Sinica,2002,34(4):333-337 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net外 ,还多出了“匕 l5”这个部件. 但是多出来的部件 并不是同相应的汉字完全无关 ,它们总是与实际的 部件有很大的相似度. 模型通过训练得到的这些结论与心理学研究中 行为实验研究的结果相似 ,从不同的方面反映了汉 字字形认知过程中的某些规律 ,体现了汉字字形认 知过程中的部分特点. 4 模型的测试 对训练好的模型进行测试 ,以输入生字来考察 模型测试效果为例 ,取生字 50个字 ,选用包括了左 右、上下、包围 3个结构的字. 测试结果如图 9所示. 图中阴影中的字为测试字 ,可以看出网络能够根据 之前学到的知识对输入的生字进行推测识别 ,测试 字根据与已学过汉字有相似的结构或部件信息放在 了这些汉字的附近 ,可以看出测试结果图中汉字的 聚类效果仍然存在 , 例如将“怅 ”放在了“张 ”的附 近 ,“训 ”放在了“计 ”的附近. 图 9 生字测试结果图 (部分 ) Fig. 9 Testing result of new Chinese character 5 结束语 从模型模拟过程中可以看出 ,对模型进行训练 , 网络通过对汉字及其部件信息的学习 ,对汉字的构 形方式、结构规则等都有了一定的认识 ,能够发现其 中的规律 ,在对学习的汉字进行其部件的拆分的同 时 ,还能将有相似结构或部件的汉字聚类 ,在一定程 度上模拟了汉字字形的认知过程. 参考文献 [ 1 ]周志华 ,曹存根. 神经网络及其应用 [M ]. 北京 :清华大 学出版社 , 2004: 366. [ 2 ]唐一源 , 张武田 ,马 林 ,翁旭初 ,李德军 ,何 华 ,贾富 仓. 默读汉字词的脑功能偏侧化成像研究 [ J ]. 心理学 报 , 2002 , 34 (4) : 3332337. TANG Yiyuan, ZHANG W utian, MA L in, W ENG Xuchu, L I Dejun, HE Hua, J IA Fucang. The laterality of brain function in silent reading of Chinese words revealed by FMR [J ]. Acta Psychological Sinica, 2002, 34 (4) : 3332337. [ 3 ]王建勤. 外国学生汉字构形意识发展的模拟研究 ———基 于自组织特征映射网络的汉字习得模型 [D ]. 北京 :北京 语言大学 , 2005. WANG Jianqin. Simulating studies of CFL learners’Chinese orthographic awareness development based on self2organizing feature map network[D ]. Beijing Language and Culture U2 niversity, 2005. [4 ]邢红兵.小学语言教材形声字表音情况统计分析及小学生 形声字命名的自组织模型 [D ].北京:北京师范大学 , 2002. XING Hongbing. Analysis of phonetics of semantic2phonetic compound characters in elementary school textbooks and a self2 organizing connectionist model of character acquisition in Chi2 nese[D ]. Beijing Language and Culture University, 2002. [ 5 ]舒 华 ,韩在住 ,许忠宝. 认知神经心理学的基本假设和 研究方法 [J ]. 心理科学 , 2002 (6) : 7212722. SHU Hua, HAN Zaizhu, XU Zhongbao. The basal hypothe2 ses and research methods in cognitive neurop sychology[J ]. Psychological Science, 2002 (6) : 7212722. [ 6 ]边肇祺 ,张学工. 模式识别 [M ]. 北京 :清华大学出版社 , 2000: 259. [7 ]KANAGAS J, KOHONEN T. Developments and applications of the self2organizingmap and related algorithms[J ]. Mathematics and Computers in Simulation, 1996, 41: 3212. [ 8 ]L I P, FARKAS I, MACWH INNEY B. Early lexical devel2 opment in a self2organizing neural network[J ]. Neural Net2 works, 2004 (17) : 134521362. 作者简介 : 陈 静 ,女 , 1979年生 ,博士研究 生 ,主要研究方向为人工智能、模式识 别. 穆志纯 ,男 , 1952年生 ,教授 ,博士 生导师 ,主要研究方向为人工智能及其 应用、模式识别、图像处理、生物特征识 别、复杂系统的建模与控制. 1989 ~ 1991年和 1997~1999年间在英国进行 访问研究. 曾主持、参加国家自然科学 基金项目 4项、青年“863”项目 1项、国家科技攻关和国际合 作项目多项 ,并获部级科技进步二等奖 1项、三等奖 2项. 已 发表论文 90余篇 ,其中被 SCI和 EI检索 40余篇. 孙筱倩 ,女 , 1983年生 ,硕士研究 生 ,主要研究方向为人工智能、模式识 别. 第 3期 陈 静 ,等 :计算机模拟汉字字形认知过程的研究 · 122 ·