正在加载图片...
第1期 杜大鹏等:一种用于模拟汉字认知过程的多层自组织神经网络 ,105 汉字的部件序列与网络拆分结果对比结果如表1 初学者对汉字的部分认知过程,主要包括汉字结构 所示 类型的学习和汉字部件的识别两个主要方面,模拟 表1汉字部件识别的结果 研究在一定程度上是成功的,但是模型仍然不够完 Table 1 Results of the components recognition 善,未能将学习者的知识背景对认知过程的影响考 牧字 正确部件序列 网辂学习结果 虑在内,如母语为汉语的小学生和母语为拼音文字 柴 止b1匕b2木b7 止b1匕b2木b7匕15 的留学生,他们的汉字认知过程受其母语和知识结 衣 衣m4 衣m4衣k4 构的影响,必然有所差异,总之,本文所作的模拟研 和 禾al口a7 禾al口a7 究在利用神经网络研究语言习得问题方面具有参考 闻 门f1耳f7 门f1耳7 和借鉴价值,并且在研究基础上,可以利用模型进一 袍 tal勹a6巳a7 11礻al勹6勹b6 步研究汉字发音、构词、字义等语言习得方面的认知 妙 女a1小a6a7 女al小6乙a7 过程 吻 口a1勹a6a7 口1勹6少7 参考文献 唤 口al7b1冂a5大a7 日al人a516大a7 [1]KohonenT.Self-organized formation of topologically correct fea 相同形体的部件位于不同结构类型汉字的不同 ture maps.Biol Cybern.1982 (43):59 位置时,则被认为是不同的部件,区分方式则是在基 [2]Ritter H.Kohonen T.Self-organizing semantic maps.Biol Cy- berm,1989,61:241 本部件之后追加英文和数字.所以上表中“衣m4” [3]Mikkulainen R.Dyslexic and category"specific aphasic impair 和“衣k4”代表不同的部件 ments in a self-organizing feature map model of the lexicon.Brain 从表1的结果中,可以归纳出两种情况: Language,1997(59):334 (1)网络对汉字的学习是成功的,也就是学习 [4]Farkas I.Li P.DEVLEX:a self-organizing neural network mod- el of the development of lexicon//Proceedings of the 9th Interna- 结果是完全正确的.如表中的“和”、“闻”和“吻”字, tional Conference on Neural Information Processing (ICONIP 部件层的激活神经元所代表的部件与汉字的实际部 02),2002:2546 件拆分结果相吻合 [5]Li P.Farkas I,MacWhinney B.Early lexical development in a (2)网络对汉字的学习是不完全成功的.在这 selforganizing neural network.Neural Networks.2004 (17): 1345 种情况下,又分为部件混淆和部件冗余两种出错类 [6]彭聃龄,刘颖,陈鹰.汉字识别的计算机模拟·应用心理学, 型.部件混淆是指部件层激活的部件序列中,部件 1996,2(1):9 数目与实际相符,但是存在一个或几个部件与相应 [7]刘颖,彭聃龄。基于语义的词汇判断的计算机模型.心理学 的实际部件不符.如“换”字的激活部件中的“夕b1” 报,1995,27(3):254 和“门a5”,在实际序列中找不到完全吻合的部件, [8]刘政凯,李葆馨.Kohonen自组织特征映射模型的推广.自动 但是可以找到与之形似的部件“入a5"和“1a6”. 化学报,1994,20(3):338 [9]李平.语言习得的联结主义模式·当代语言学,2002,4(3):8 部件冗余则是指激活的部件多于实际部件数目,如 [10]王建勤.外国学生汉字构形意识发展的模拟研究[学位论 “柴”字,在学习结果中,除了正确激活的“匕b2”外, 文],北京:北京语言大学,2005 还多出了“匕15”这个部件.但是多出来的部件并不 [11]苑春法,李莼,崔永华,等.基与遗传算法的汉语构词研究 是同相应的汉字完全无关,它们总是与实际的部件 清华大学学报:自然科学版,2001,41(4/5).222 [12]李娟,傅小兰,林仲贤。学龄儿童汉语正字法意识发展的研 有很大的相似度 究.心理学报,2000,32(2):121 4结论 [13]鹿士义.母语为拼音文字的学习者汉字正字法意识发展的研 究.语言教学与研究,2002(3).55 本文利用多层自组织神经网络模型模拟了汉语汉字的部件序列与网络拆分结果对比结果如表1 所示. 4 结论 本文利用多层自组织神经网络模型模拟了汉语 初学者对汉字的部分认知过程‚主要包括汉字结构 类型的学习和汉字部件的识别两个主要方面.模拟 研究在一定程度上是成功的‚但是模型仍然不够完 善‚未能将学习者的知识背景对认知过程的影响考 虑在内‚如母语为汉语的小学生和母语为拼音文字 的留学生‚他们的汉字认知过程受其母语和知识结 构的影响‚必然有所差异.总之‚本文所作的模拟研 究在利用神经网络研究语言习得问题方面具有参考 和借鉴价值‚并且在研究基础上‚可以利用模型进一 步研究汉字发音、构词、字义等语言习得方面的认知 过程. 参 考 文 献 [1] Kohonen T.Self-organized formation of topologically correct fea￾ture maps.Biol Cybern‚1982(43):59 [2] Ritter H‚Kohonen T.Self-organizing semantic maps.Biol Cy￾bern‚1989‚61:241 [3] Miikkulainen R.Dyslexic and category-specific aphasic impair￾ments in a self-organizing feature map model of the lexicon.Brain Language‚1997(59) :334 [4] Farkas I‚Li P.DEVLEX:a self-organizing neural network mod￾el of the development of lexicon∥Proceedings of the9th Interna￾tional Conference on Neural Information Processing (ICONIP’ 02)‚2002:2546 [5] Li P‚Farkas I‚MacWhinney B.Early lexical development in a sel-f organizing neural network.Neural Networks‚2004 (17): 1345 [6] 彭聃龄‚刘颖‚陈鹰.汉字识别的计算机模拟.应用心理学‚ 1996‚2(1):9 [7] 刘颖‚彭聃龄.基于语义的词汇判断的计算机模型.心理学 报‚1995‚27(3) :254 [8] 刘政凯‚李葆馨.Kohonen 自组织特征映射模型的推广.自动 化学报‚1994‚20(3) :338 [9] 李平.语言习得的联结主义模式.当代语言学‚2002‚4(3):8 [10] 王建勤.外国学生汉字构形意识发展的模拟研究 [学位论 文].北京:北京语言大学‚2005 [11] 苑春法‚李莼‚崔永华‚等.基与遗传算法的汉语构词研究. 清华大学学报:自然科学版‚2001‚41(4/5):222 [12] 李娟‚傅小兰‚林仲贤.学龄儿童汉语正字法意识发展的研 究.心理学报‚2000‚32(2) :121 [13] 鹿士义.母语为拼音文字的学习者汉字正字法意识发展的研 究.语言教学与研究‚2002(3):55 第1期 杜大鹏等: 一种用于模拟汉字认知过程的多层自组织神经网络 ·105·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有