正在加载图片...
第5章单词与词组的处理与分析 对于机器翻译系统来说,为了适应不同专业领域的翻译要求,需要配有大 量的专业词汇。因此,机器翻译系统的词典又可以分为通用词典和专业词典两部 分。如专门的缩略语词典、特殊字词典等等。还可以把通用词典再细分为名词词 典、动词词典、成语词典等等。 机器词典的组织机构对于提高词语的检索速度是非常主要的。一定的组织结 构形式和相应的算法相配合,可以节约存储空间,提高检索速度,从而提高机器 翻译系统的整体翻译速度。 机器词典从存储形式来看,可以分为定长字段型、变长字段型和定变长混 合型三种类型;从索引格式看,可以分为级索引和多级索引等等。 词语的长短是不同的,例如,某些常用词的信息特别丰富,书本词典可以占 满几页,而有一些词语却只要一行。这样,如果所有词语都使用定长字段,则必 须依据最长词语确定字段长度,而相当多的短词语将浪费巨大的存储空间。所以 般情况下一条词语的有关信息的存储都采用变长形式,这可以用链接技术实现第 5 章 单词与词组的处理与分析 对于机器翻译系统来说,为了适应不同专业领域的翻译要求,需要配有大 量的专业词汇。因此,机器翻译系统的词典又可以分为通用词典和专业词典两部 分。如专门的缩略语词典、特殊字词典等等。还可以把通用词典再细分为名词词 典、动词词典、成语词典等等。 机器词典的组织机构对于提高词语的检索速度是非常主要的。一定的组织结 构形式和相应的算法相配合,可以节约存储空间,提高检索速度,从而提高机器 翻译系统的整体翻译速度。 机器词典从存储形式来看,可以分为定长字段型、变长字段型和定变长混 合型三种类型;从索引格式看,可以分为一级索引和多级索引等等。 词语的长短是不同的,例如,某些常用词的信息特别丰富,书本词典可以占 满几页,而有一些词语却只要一行。这样,如果所有词语都使用定长字段,则必 须依据最长词语确定字段长度,而相当多的短词语将浪费巨大的存储空间。所以, 一般情况下一条词语的有关信息的存储都采用变长形式,这可以用链接技术实现
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有