·456· 智能系统学报 第13卷 2.5词缀覆盖率 维吾尔谚语系统的分析、设计与实现详细地说 计算词缀覆盖率时,对收集的6490条维吾尔 明系统的设计路线和功能模块,并进行小规模的实 谚语进行分析。其中包含后缀的维吾尔谚语共3786 验,即测试系统。本文阐述了维吾尔谚语规则库、 条,由中词缀相连接的维吾尔谚语共1555条,由双 源数据库和设计系统的模型与设计中的一些细节, 中缀和多中缀相连接的维吾尔谚语共2356条。因 并且对维吾尔谚语语料库的各项语料统计进行分 为谚语本身句法结构多样,附加成分(词缀)连接 析,为自动识别系统提供了良好的基础。系统依据 特征极其不规律,包含上述词缀的维吾尔谚语共 用户所提交的含有维吾尔谚语的任何一种格式的文 4934条,覆盖率百分比为75.81%。其余1556条 本,通过关键词和相关符号,与语料库、规则库进行 维吾尔谚语是没有特殊的语法结构或者没有包含特 判断,获得所需的维吾尔谚语,根据需要进行查询 定的词缀,未覆概率百分比为24.19%。其数据分析 与匹配,进行统计与分类,可快速地找到所需数 如表5所示。 据。本研究除了在语言理解、维汉汉维机器翻译中 表5谚语词缀覆盖率 起重要作用之外,还能为中考、高考中考维吾尔语 Table 5 Proverbs suffix coverage 语文的全体学生提供一个良好的学习平台,对教学 匹配谚匹配覆未匹配未匹配 词缀类型 个数 研究及推广维吾尔语言也会起到很大作用。 语个数盖率%谚语覆盖率% 双中缀和多中缀34 2356 36.30 4134 63.9 参考文献: 中缀 61555 23.964935 76.04 []杨艳,何天字.基于短语的关系数据库关键词查询方法), 后缀 35378658.33 2704 41.66 计算机研究与发展,2012,49S1):276-282 YANG Yan,HE Tianyu.Phrase-based keyword search over 表5中分别显示每一种功能语类(词缀)在 relational databases[J].Computer research and development, 维吾尔谚语语料库中占的百分比,其中被双中缀和 2012,49(S1):276-282 多中缀覆盖的维吾尔谚语占总谚语的36.30%,唯有 [2]张红雨.汉维谚语对比D1.重庆:西南大学,2010:15-20. 中缀和后缀覆盖的维吾尔谚语分别占为23.96% ZHANG Hongyu.The development of chemical curriculum 和58.33%。值得一提的是,维吾尔谚语语料库里 comparision of Chinese Uighur proverbs[D].Chongqing: 的6490条维吾尔谚语中的某些维吾尔谚语有同时 Southwest University,2010:15-20. 与后缀和中缀以及双中缀相连接的可能性,即系统 [3)杨德明.再论维吾尔谚语的翻译).民族翻译,2014(4): 从文本中识别出维吾尔谚语时,有可能会在同一条 81-86. 维吾尔谚语本身匹配到上述的3种词缀。比如: YANG Deming.On the translation of Uyghur proverbs[J]. s:维吾尔文 Minority translators journal,2014(4):81-86. 汉译:(没有青杏哪来杏仁)四 [4马俊民.论维语谚语的汉译】.语言与翻译,1985(3): 此谚语中包含后缀和中缀,假设关系5山…格 47-52 式,还有否定形式词缀:在动词词干后附加词尾 MA Junmin.On the translation of Uyghur language into Chinese[J].Language and translation,1985(3):47-52 yohoipdlo o 本文中的覆盖率是指所有谚语词缀的频率由高 [⑤)]芦风娟.基于语料库的英语谚语及其变体使用研究D] 临汾:山西师范大学,2013:12-15, 到底降序排列时其每一条谚语词缀与其整个谚语的 频率之和在全部语料中所占的比重,用来度量测试 LU Fengjuan.A corpus-based study on the Usage of Eng- 完整性和测试有效性0,如公式(1)所示。 lish proverbs and their variations[D].Linfen:Shanxi Nor- mal University,2013:12-15. F=∑是x10% (1) [6]马俊民,廖泽余.维汉对照维吾尔谚语M.乌鲁木齐:新 式中:F,为识别对象i的覆盖率,n,为识别对象i 疆人民出版社,2007:1-300. 的出现次数,N为所有语料中调查对象出现的总量。 [刀陈雪慧.汉维谚语中比喻修辞对比研究D].乌鲁木齐:新 疆师范大学,2013:8-12 3结束语 CHEN Xuehui.Chinese proverbs and Uygur proverbs com- parative study of figures of speech[D].Urumchi:Xinjiang 本文从计算语言学理论角度归纳出维吾尔谚语 Normal University,2013:8-12. 的语法结构模式,为文本中自动识别维吾尔谚语系 [8]力提甫托乎提,从短语结构到最简方案:阿尔泰语言的 统的实现构建了较完整的维吾尔谚语语料库与只属 句法结构M.北京:中央民族大学出版社,2004:80-140. 于维吾尔谚语语法的维吾尔谚语规则知识库。 [9]刘正江.维吾尔语成语研究概述】.喀什师范学院学报2.5 词缀覆盖率 计算词缀覆盖率时,对收集的 6 490 条维吾尔 谚语进行分析。其中包含后缀的维吾尔谚语共 3 786 条,由中词缀相连接的维吾尔谚语共 1 555 条,由双 中缀和多中缀相连接的维吾尔谚语共 2 356 条。因 为谚语本身句法结构多样,附加成分 (词缀) 连接 特征极其不规律,包含上述词缀的维吾尔谚语共 4 934 条,覆盖率百分比为 75.81%。其余 1 556 条 维吾尔谚语是没有特殊的语法结构或者没有包含特 定的词缀,未覆概率百分比为 24.19%。其数据分析 如表 5 所示。 表 5 谚语词缀覆盖率 Table 5 Proverbs suffix coverage 词缀类型 个数 匹配谚 语个数 匹配覆 盖率/% 未匹配 谚语 未匹配 覆盖率/% 双中缀和多中缀 34 2 356 36.30 4134 63.9 中缀 6 1 555 23.96 4935 76.04 后缀 35 3 786 58.33 2704 41.66 表 5 中分别显示每一种功能语类 (词缀) 在 维吾尔谚语语料库中占的百分比,其中被双中缀和 多中缀覆盖的维吾尔谚语占总谚语的 36.30%,唯有 中缀和后缀覆盖的维吾尔谚语分别占为 23.96% 和 58.33%。值得一提的是,维吾尔谚语语料库里 的 6 490 条维吾尔谚语中的某些维吾尔谚语有同时 与后缀和中缀以及双中缀相连接的可能性,即系统 从文本中识别出维吾尔谚语时,有可能会在同一条 维吾尔谚语本身匹配到上述的 3 种词缀。比如: :维吾尔文 汉译:(没有青杏哪来杏仁) [11]。 此谚语中包含后缀和中缀,假设关系 格 式,还有否定形式词缀:在动词词干后附加词尾 。 本文中的覆盖率是指所有谚语词缀的频率由高 到底降序排列时其每一条谚语词缀与其整个谚语的 频率之和在全部语料中所占的比重,用来度量测试 完整性和测试有效性[20] ,如公式 (1) 所示。 Fi = ∑ ni N ×100% (1) 式中:Fi 为识别对象 i 的覆盖率,ni 为识别对象 i 的出现次数,N 为所有语料中调查对象出现的总量。 3 结束语 本文从计算语言学理论角度归纳出维吾尔谚语 的语法结构模式,为文本中自动识别维吾尔谚语系 统的实现构建了较完整的维吾尔谚语语料库与只属 于维吾尔谚语语法的维吾尔谚语规则知识库。 维吾尔谚语系统的分析、设计与实现详细地说 明系统的设计路线和功能模块,并进行小规模的实 验,即测试系统。本文阐述了维吾尔谚语规则库、 源数据库和设计系统的模型与设计中的一些细节, 并且对维吾尔谚语语料库的各项语料统计进行分 析,为自动识别系统提供了良好的基础。系统依据 用户所提交的含有维吾尔谚语的任何一种格式的文 本,通过关键词和相关符号,与语料库、规则库进行 判断,获得所需的维吾尔谚语,根据需要进行查询 与匹配,进行统计与分类,可快速地找到所需数 据。本研究除了在语言理解、维汉/汉维机器翻译中 起重要作用之外,还能为中考、高考中考维吾尔语 语文的全体学生提供一个良好的学习平台,对教学 研究及推广维吾尔语言也会起到很大作用。 参考文献: 杨艳, 何天宇. 基于短语的关系数据库关键词查询方法[J]. 计算机研究与发展, 2012, 49(S1): 276–282. YANG Yan, HE Tianyu. Phrase-based keyword search over relational databases[J]. Computer research and development, 2012, 49(S1): 276–282. [1] 张红雨. 汉维谚语对比[D]. 重庆: 西南大学, 2010: 15-20. ZHANG Hongyu. The development of chemical curriculum comparision of Chinese Uighur proverbs[D]. Chongqing: Southwest University, 2010: 15-20. [2] 杨德明. 再论维吾尔谚语的翻译[J]. 民族翻译, 2014(4): 81–86. YANG Deming. On the translation of Uyghur proverbs[J]. Minority translators journal, 2014(4): 81–86. [3] 马俊民. 论维语谚语的汉译[J]. 语言与翻译, 1985(3): 47–52. MA Junmin. On the translation of Uyghur language into Chinese[J]. Language and translation, 1985(3): 47–52. [4] 芦风娟. 基于语料库的英语谚语及其变体使用研究[D]. 临汾: 山西师范大学, 2013: 12-15. LU Fengjuan. A corpus-based study on the Usage of English proverbs and their variations[D]. Linfen: Shanxi Normal University, 2013: 12-15. [5] 马俊民, 廖泽余. 维汉对照维吾尔谚语[M]. 乌鲁木齐: 新 疆人民出版社, 2007: 1-300. [6] 陈雪慧. 汉维谚语中比喻修辞对比研究[D]. 乌鲁木齐:新 疆师范大学, 2013: 8-12. CHEN Xuehui. Chinese proverbs and Uygur proverbs comparative study of figures of speech[D]. Urumchi: Xinjiang Normal University, 2013: 8-12. [7] 力提甫·托乎提. 从短语结构到最简方案: 阿尔泰语言的 句法结构[M]. 北京: 中央民族大学出版社, 2004: 80-140. [8] [9] 刘正江. 维吾尔语成语研究概述[J]. 喀什师范学院学报, ·456· 智 能 系 统 学 报 第 13 卷