计算机辅助翻译 Computer Aided Translation 第十四讲基于CAT翻译记忆库的 翻译研究
计算机辅助翻译 Computer Aided Translation 第十四讲 基于CAT翻译记忆库的 翻译研究
课前思考: 1、什么是语料库?如何将语料库用于翻译研究中? 2、基于语料库的翻译研究有什么优势? 3、基于语料库的翻译研究有什么样的局限性?
课前思考: 1、什么是语料库?如何将语料库用于翻译研究中? 2、基于语料库的翻译研究有什么优势? 3、基于语料库的翻译研究有什么样的局限性?
语料库与翻译研究
语料库与翻译研究
Corpus的含义及语料库发展 英文 corpus一词源于拉丁语,本意为“body"(身体、躯体)。 语料库从本质上讲,就是“依照某种原则方式所收集的大 量文本总汇”。 语言学研究中所谈到的语料库,是指运用计算机技术,按 照一定的语言学原则,为了特定的研究目的而大规模收集 并贮存的真实语料,这些语料经过一定程度的标注,便于 检索,可应用于描述和实证研究
Corpus的含义及语料库发展 英文corpus一词源于拉丁语,本意为“body”(身体、躯体)。 语料库从本质上讲,就是“依照某种原则方式所收集的大 量文本总汇” 。 语言学研究中所谈到的语料库,是指运用计算机技术,按 照一定的语言学原则,为了特定的研究目的而大规模收集 并贮存的真实语料,这些语料经过一 定程度的标注,便于 检索,可应用于描述和实证研究
语料库的应用 语言研究 对比研究 翻 语料库类型 译语言翻译单双语词|机助翻译与 研 教学 典研编 翻译软 究 件开发 单一原创 单语语 语 料库单一翻译 语言 翻译 双语语对应平行 料库 类比 翻译 多语对应平行√ 类比
语料库类型 语 言 研 究 对 比 研 究 翻 译 研 究 语言/翻译 教学 单/双语词 典研编 机助/翻译与 翻译软 件开发 单语语 料库 单一原创 语言 √ √ 单一翻译 语言 √ √ 双语语 料库 翻译 √ √ √ √ 对应/平行 √ √ √ √ √ √ 类比 √ √ 多语语 料库 翻译 √ √ √ √ 对应/平行 √ √ √ √ √ √ 类比 √ √ 语料库的应用
语料库的发展经历了三个阶段 发展阶段时期 特点及应用 典型代表 原始语料18世纪20世纪主要应用于语汇索参。 Alexander Cruden于1736年出版 手工收集原语料;无标注 的钦定版《圣经》语汇检索 库 初 典编纂、方言研究、语 Dr. Johnson于1755年出版的 言教学研究和语法研究 《英语词典》( A Dictionary of the English language 由手工收集向计算机语料 Randolph Quirk的“英语用法调 库过渡;初步依照一定查”( the Survey of English 现代语料20世纪50-80年 语言学原则进行标注。 Usage)语料库;布朗语料 库 代 主要用于语法分析和语库( the Brown Corpus 言对比研究,逐渐涉及兰卡斯特奥斯陆卑尔根 其它领域。 (LOB)语料库等。 语料库呈现超大规模趋势 类型更加丰富,应用更共建英语语料库( the Cobuild 当代语料20世纪90年代至加广泛,包括:语言研 Bank of English);朗文语 库 今 究、对比研究、翻译研 料库( Longman);英国国 究、教学研究词典编纂,家语料库(BNC);国际英 以及机器翻译和软件开语语料库(CE)等 发等
语料库的发展经历了三个阶段 发展阶段 时期 特点及应用 典型代表 原始语料 库 18世纪-20世纪 初 手工收集原语料;无标注。 主要应用于语汇索引、词 典编纂、方言研究、语 言教学研究和语法研究 。 Alexander Cruden于1736年出版 的钦定版《圣经》语汇检索; Dr. Johnson于1755年出版的 《英语词典》(A Dictionary of the English Language)。 现代语料 库 20世纪50-80年 代 由手工收集向计算机语料 库过渡;初步依照一定 语言学原则进行标注。 主要用于语法分析和语 言对比研究,逐渐涉及 其它领域。 Randolph Quirk的“英语用法调 查”(the Survey of English Usage)语料库;布朗语料 库(the Brown Corpus); 兰卡斯特-奥斯陆-卑尔根 (LOB)语料库等。 当代语料 库 20世纪90年代至 今 语料库呈现超大规模趋势; 类型更加丰富,应用更 加广泛,包括:语言研 究、对比研究、翻译研 究、教学研究词典编纂, 以及机器翻译和软件开 发等。 共建英语语料库(the Cobuild Bank of English);朗文语 料库(Longman);英国国 家语料库(BNC);国际英 语语料库(ICE)等
翻译研究范式的发展 ·语文研究 语言学研究 文化研究 哲学研究 认知研究
翻译研究范式的发展 • 语文研究 • 语言学研究 • 文化研究 • 哲学研究 • 认知研究
基于语料库的翻译研究就是以文本语料为基础,从 直觉出发产生关于翻译现象的假设,并对这些假设 进行系统的研究
基于语料库的翻译研究就是以文本语料为基础,从 直觉出发产生关于翻译现象的假设,并对这些假设 进行系统的研究
翻译研究中语料库研究方法的理论框架 ·第一,描写研究 ·第二,普遍性研究 ·第三,翻译的语境化研究
翻译研究中语料库研究方法的理论框架 • 第一,描写研究 • 第二,普遍性研究 • 第三,翻译的语境化研究
不完善之处 第一,文本语料不可能穷尽。 第二,语料库文本选择带有一定的主观性和偶然性 第三,原创语言作品以及翻译作品的质量应当以什么样的 标准来衡量? 第四,双语文本的对应问题
不完善之处 • 第一,文本语料不可能穷尽。 • 第二,语料库文本选择带有一定的主观性和偶然性。 • 第三,原创语言作品以及翻译作品的质量应当以什么样的 标准来衡量? • 第四,双语文本的对应问题