3-3 Sub ject Retrieval language 主题检索语言的概念与特点 主题检索语言的基本类型 三、《汉语主题词表》与文献标引 思考题
1 3-3 Subject Retrieval Language 一、主题检索语言的概念与特点 二、主题检索语言的基本类型 三、《汉语主题词表》与文献标引 思考题
主题检索语言的概念与特点 1、1主题检索语言是指采用描述文献主题的语词标识并按字顺排检的 信息检索语言。一般由主题词表及其编制和使用规则组成 1、2主题检索语言的基本特点 规范化的名词术语直接作为文献主题标识,直观性较好;而体系 分类法的类号是规范化的,类目名称却不经过严格规范。 按字顺序列排检标识,检索者较易使用;而分类检索语言按知识 系统排列,用号码表达概念,有一定的间接性。 按主题集中文献信息,对有关某一事物的检索效率高;而分类检 索语言以学科专业为线索集中文献 用参照系统及其他方法间接显示文献概念之间的关系,其系统性 较差;分类检索语言能够直接显示概念关系 ■接近自然语言,容易与自然语言结合使用
2 一、主题检索语言的概念与特点 1、1主题检索语言是指采用描述文献主题的语词标识并按字顺排检的 信息检索语言。一般由主题词表及其编制和使用规则组成。 1、2主题检索语言的基本特点 ◼ 规范化的名词术语直接作为文献主题标识,直观性较好;而体系 分类法的类号是规范化的,类目名称却不经过严格规范。 ◼ 按字顺序列排检标识,检索者较易使用;而分类检索语言按知识 系统排列,用号码表达概念,有一定的间接性。 ◼ 按主题集中文献信息,对有关某一事物的检索效率高;而分类检 索语言以学科专业为线索集中文献。 ◼ 用参照系统及其他方法间接显示文献概念之间的关系,其系统性 较差;分类检索语言能够直接显示概念关系。 ◼ 接近自然语言,容易与自然语言结合使用
、主题检索语言的基本类型 2 1 System of subject heading 2、2 Uniterm indexing 2,3 Descriptor indexing 2、4 Keyword indexing
3 二、主题检索语言的基本类型 2、1 System of subject heading 2、2 Uniterm indexing 2、3 Descriptor indexing 2、4 Keyword indexing
2, 1 System of subject heading 标题法的概念:以标题词作为检索标识的文献与检索方法。具体 而言,标题法是用规范化名词术语作为标识,来直接表达文献所 论及或涉及的主题,并将全部标识按字顺排列,通过参照系统来 显示各个标识所表达的主题之间的相互关系的一种主题法 标题法的基本特点:(1)采用规范的检索标识,主、副标题词经规 范化处理后按固定的顺序排列在标题词表中。(2)采用定组方式 即以主标题词与副标题词的固定形式组配来表现某一主题概念。 (3)采用二元组配,即一组检索款目多由一个主标题词和一个副标 题词组成。此外,标题词表中一般只反映同义词的“用-代”关系, 不反映同族词的“属-分”关系,族性检索功能较差。 标题词表:一般由编制说明和主词表等部分构成,主表按主标题 词字顺排序,在同一主标题词下再将与之有关的副标题词逐一排 列。用see和 see also显示标题词之间的相互关系
4 2、1 System of subject heading ◼ 标题法的概念:以标题词作为检索标识的文献与检索方法。具体 而言,标题法是用规范化名词术语作为标识,来直接表达文献所 论及或涉及的主题,并将全部标识按字顺排列,通过参照系统来 显示各个标识所表达的主题之间的相互关系的一种主题法。 ◼ 标题法的基本特点:⑴采用规范的检索标识,主、副标题词经规 范化处理后按固定的顺序排列在标题词表中。⑵采用定组方式, 即以主标题词与副标题词的固定形式组配来表现某一主题概念。 ⑶采用二元组配,即一组检索款目多由一个主标题词和一个副标 题词组成。此外,标题词表中一般只反映同义词的“用-代”关系, 不反映同族词的“属-分”关系,族性检索功能较差。 ◼ 标题词表:一般由编制说明和主词表等部分构成,主表按主标题 词字顺排序,在同一主标题词下再将与之有关的副标题词逐一排 列。用see和see also显示标题词之间的相互关系
2、2 Uniterm indexing 元词法的概念:以单元词作为检索标识的文献标引和检索方法 它是对标题法先组式标识进行改革而形成的一种后组式语言。元 词是指能够表达文献主题,经过规范化处理的最小、最基本的词 汇单元,具有概念上的独立性、单元性和规范性的特点 ■元词法的基本原理:任何一个复合概念都可以分解为若干单元概 念,而每个单元概念通常只用一个元词来表达,通过单元词的组 配来表达复杂的文献主题概念。元词法的基本原理有两个构件, 即单元词表和单元词卡片 元词法的主要特点:用较少的词量反映较多的主题概念,具有灵 活性和专指性,在各种词表中,单元词表的体积最小。但元词法 缺乏直接性和系统性,由于常常采用字面组配,易产生组配误差, 检索的査准率较低
5 2、2 Uniterm indexing ◼ 元词法的概念:以单元词作为检索标识的文献标引和检索方法。 它是对标题法先组式标识进行改革而形成的一种后组式语言。元 词是指能够表达文献主题,经过规范化处理的最小、最基本的词 汇单元,具有概念上的独立性、单元性和规范性的特点。 ◼ 元词法的基本原理:任何一个复合概念都可以分解为若干单元概 念,而每个单元概念通常只用一个元词来表达,通过单元词的组 配来表达复杂的文献主题概念。元词法的基本原理有两个构件, 即单元词表和单元词卡片。 ◼ 元词法的主要特点:用较少的词量反映较多的主题概念,具有灵 活性和专指性,在各种词表中,单元词表的体积最小。但元词法 缺乏直接性和系统性,由于常常采用字面组配,易产生组配误差, 检索的查准率较低
2 3 Descriptor indexing ◇叙词法的概念与原理 叙词的类型和语义关系 Ⅲ叙词表及叙词索引
6 2、3 Descriptor indexing 叙词法的概念与原理 叙词的类型和语义关系 叙词表及叙词索引
◇叙词法的概念与原理 叙词法以自然语言为基础,以规范化的叙词作为检索标识的文献标引 与检索方法。叙词法多种信息检索语言的原理和方法的综合 1)在语词标识上:吸收了标题法对语词进行严格规范化的基本方法, 对语词进行词类、词形、词义、词间关系等多种规范。 (2)在语词组配上:适当采用标题法的预先组配,吸收元词法的元词 组配原理和后组技术,采用组配分类法的概念组配和词汇分面分 类表技术 (3)在语词关系上:采用体系分类法的基本原理编制叙词分类索引和 等级索引,采用与键词法类似的方法编制叙词轮排索引,进一步 完善了标题法的参照系统,从而从多方面显示叙词间的相互关系 由此看来,叙词法的基本性质,就是一种采用表示单元概念的规范化 语词的组配来对文献主题进行描述的后组式词汇型标识系统
7 叙词法的概念与原理 叙词法以自然语言为基础,以规范化的叙词作为检索标识的文献标引 与检索方法。叙词法多种信息检索语言的原理和方法的综合。 ⑴ 在语词标识上:吸收了标题法对语词进行严格规范化的基本方法, 对语词进行词类、词形、词义、词间关系等多种规范。 ⑵ 在语词组配上:适当采用标题法的预先组配,吸收元词法的元词 组配原理和后组技术,采用组配分类法的概念组配和词汇分面分 类表技术。 ⑶ 在语词关系上:采用体系分类法的基本原理编制叙词分类索引和 等级索引,采用与键词法类似的方法编制叙词轮排索引,进一步 完善了标题法的参照系统,从而从多方面显示叙词间的相互关系。 由此看来,叙词法的基本性质,就是一种采用表示单元概念的规范化 语词的组配来对文献主题进行描述的后组式词汇型标识系统
叙词的类型和语义关系 叙词是以概念为基础,经过优选和规范化并具有概念组配和语 义关系显示功能,用以表达文献主题和检索需求的词或词组。 叙词可以划分为普通叙词和专用叙词。普通叙词指表示各种事 物及其属性的叙词,它表达的通常是普通概念;专用叙词则是 表示某一特定事物的叙词,它表达的都是单独或特定概念。 ■叙词语言具有严密的语义关系。根据词义的需要,叙词相互之 间有3种语义关系:(1)等同关系(用一代),指叙词与非叙词之 间的关系。(2)等级关系(分一属一族),指专指度深浅不同的 两个叙词之间的隶属关系。(3相关关系(参一参),指叙词之 间存在一定的关联、交错、对立和矛盾的关系(或称类缘关 系),两者互为参照
8 叙词的类型和语义关系 ◼ 叙词是以概念为基础,经过优选和规范化并具有概念组配和语 义关系显示功能,用以表达文献主题和检索需求的词或词组。 叙词可以划分为普通叙词和专用叙词。普通叙词指表示各种事 物及其属性的叙词,它表达的通常是普通概念;专用叙词则是 表示某一特定事物的叙词,它表达的都是单独或特定概念。 ◼ 叙词语言具有严密的语义关系。根据词义的需要,叙词相互之 间有3种语义关系:⑴等同关系(用-代),指叙词与非叙词之 间的关系。⑵ 等级关系(分-属-族),指专指度深浅不同的 两个叙词之间的隶属关系。⑶相关关系(参-参),指叙词之 间存在一定的关联、交错、对立和矛盾的关系(或称类缘关 系),两者互为参照
叙词表及叙词索引 叙词表( Thesaurus)是指将自然语言转换成规范化的叙词型主题 检索语言的术语控制工具,亦称主题词表。它是一种概括某一学 科领域,以规范化的、受控的、动态的叙词为基本成份和以参照 系统显示词间关系,用于标引、存储和检索文献的词典 ■叙词表一般由一个主表和若干个辅表组成。主表亦称字顺表,是 将全部主题词按字顺排列,并添加必要的标注项和显示词间等同 等级或相关关系的参照项,它是叙词表的主体结构。附表则是各 种专有叙词索引,如地区索引、机构索引、人名索引、产品索引 等,它是从主表中分离出来的专用词汇表。附表通常是叙词表的 辅助部分
9 叙词表及叙词索引 ◼ 叙词表(Thesaurus)是指将自然语言转换成规范化的叙词型主题 检索语言的术语控制工具,亦称主题词表。它是一种概括某一学 科领域,以规范化的、受控的、动态的叙词为基本成份和以参照 系统显示词间关系,用于标引、存储和检索文献的词典。 ◼ 叙词表一般由一个主表和若干个辅表组成。主表亦称字顺表,是 将全部主题词按字顺排列,并添加必要的标注项和显示词间等同、 等级或相关关系的参照项,它是叙词表的主体结构。附表则是各 种专有叙词索引,如地区索引、机构索引、人名索引、产品索引 等,它是从主表中分离出来的专用词汇表。附表通常是叙词表的 辅助部分
叙词表·主表款目▲ Bianji Xiaoyong Xuepai 范畴类号 边际效用学派←5DB 款目叙词 Marginal utility school D边际学派 代参照 边际主义 F奥地利学派 分参照 剑桥学派 洛桑学派 数理学派 S庸俗资产阶级政治经济学← 属对照 经济学派 族首词符号 Z政治经济学 族首词(有两个族首词) C费边社会主义← 参参照 凯恩斯主义/瑞典学派/新古典学派、新剑桥学派
10 叙词表·主表·款目 Bianji Xiaoyong Xuepai 范畴类号 边际效用学派 05DB 款目叙词 Marginal utility school D 边际学派 代参照 边际主义 F 奥地利学派 分参照 剑桥学派 洛桑学派 数理学派 S 庸俗资产阶级政治经济学 属对照 经济学派* 族首词符号 Z 政治经济学 族首词(有两个族首词) C 费边社会主义 参参照 凯恩斯主义/ 瑞典学派/新古典学派、新剑桥学派