Chap3 Retrieval Language 3-检索语言概述 3-2分类检索语言 3-3主题检索语言 思考题 课题4:经济管理网络信息分类的基本特征
1 Chap3 Retrieval Language 3-1 检索语言概述 3-2 分类检索语言 3-3 主题检索语言 思考题 课题4:经济管理网络信息分类的基本特征
3-1检索语言概述 检索语言的概念和特点 检索语言的类型与谱系 三、检索语言的构成和基本功能 四、检索语言的基本原理 五、检索语言的基本要求 2
2 3-1 检索语言概述 一、检索语言的概念和特点 二、检索语言的类型与谱系 三、检索语言的构成和基本功能 四、检索语言的基本原理 五、 检索语言的基本要求
“∴:…2 、信息检索语言的概念和特点 信息检索语言是根据信息检索的需要而创制的人工语言,其实质是表 它可以是从自然语言中精选出来并加以规范化的一套词汇,也可 以是代表某种分类体系的一套分类号码,还可以是代表某一类事 物的某方面特征的二套代码用以对文献内容和信息需要进行 (1)简明扼要地表达文献及其检索课题的主题概念,使词语和概念一 对应,排除一词多义、多词一义或词义含糊等现象。 (2)科学准确地匹配概念,即将检索时的标引用语和检索用语进行相 符性比较 (3)全面有效地显示概念之间的相互关系。采用等级结构、参照系统、 轮排聚类法、范畴聚类法和图示法等各种显示概念之间关系的方 法,来实现对内容相同或相关的信息加以集中或揭示其相关性
3 一、信息检索语言的概念和特点 信息检索语言是根据信息检索的需要而创制的人工语言,其实质是表 达一系列概括文献信息内容的概念及其相互关系的概念标识系统。 它可以是从自然语言中精选出来并加以规范化的一套词汇,也可 以是代表某种分类体系的一套分类号码,还可以是代表某一类事 物的某一方面特征的一套代码,用以对文献内容和信息需要进行 主题标引、逻辑分类或特征描述。 ⑴ 简明扼要地表达文献及其检索课题的主题概念,使词语和概念一 一对应,排除一词多义、多词一义或词义含糊等现象。 ⑵ 科学准确地匹配概念,即将检索时的标引用语和检索用语进行相 符性比较。 ⑶ 全面有效地显示概念之间的相互关系。采用等级结构、参照系统、 轮排聚类法、范畴聚类法和图示法等各种显示概念之间关系的方 法,来实现对内容相同或相关的信息加以集中或揭示其相关性
E、检索语言的类型与谱系 2、1依据检索语言的构成原理,把检索语言划分为分类检索语言、 主题检索语言、分类一主题一体化语言、代码语言和引文语言等 类型。 2、2依据检索语言的受控情况,把检索语言分为 Artificial Language 和 Natural Language“““ 此外,可以按检索语言的学科或专业范围、适用范围、检索标识的 组合使用方法以及对信息特征的描述等标准,对检索语言进行划 分 2、3检索语言的谱系∵
4 二、检索语言的类型与谱系 2、1 依据检索语言的构成原理,把检索语言划分为分类检索语言、 主题检索语言、分类-主题一体化语言、代码语言和引文语言等 类型。 2、2 依据检索语言的受控情况,把检索语言分为Artificial Language 和Natural Language。 此外,可以按检索语言的学科或专业范围、适用范围、检索标识的 组合使用方法以及对信息特征的描述等标准,对检索语言进行划 分。 2、3 检索语言的谱系
2、1按构成原理对检索语言进行划分 ≮分类检索语言是指使用分类号码表达文献主题标识,并按照知 分类的原理加以排列的一类信息检索语言 其主题检索语言则是指使用名词术语表达文献主题标识,并照按字 顺加以排列的一类信息检索语言。 其分类检索语言和主题检索语言相互影响、渗透、补充和结合,从 而出现了分类主题一体化语言,即分类语言和叙词语言在术语系 统、参照系统、标识系统和索引系统等方面完全实现兼容所组成 的统一体。如分面叙词表、叙词表式字顺索引、分类表一叙词表对 照索引及集成词表等等 其代码检索语言是指用来标引、检索特定专业文献的某种代码系统。 其引文检索语言则是基于文献之间的引证关系而形成的一种检索语 言。它以引文为检索词,根据引证关系将有关文献自然地耦合在 起
5 2、1 按构成原理对检索语言进行划分 分类检索语言是指使用分类号码表达文献主题标识,并按照知识 分类的原理加以排列的一类信息检索语言。 主题检索语言则是指使用名词术语表达文献主题标识,并照按字 顺加以排列的一类信息检索语言。 分类检索语言和主题检索语言相互影响、渗透、补充和结合,从 而出现了分类主题一体化语言,即分类语言和叙词语言在术语系 统、参照系统、标识系统和索引系统等方面完全实现兼容所组成 的统一体。如分面叙词表、叙词表式字顺索引、分类表-叙词表对 照索引及集成词表等等。 代码检索语言是指用来标引、检索特定专业文献的某种代码系统。 引文检索语言则是基于文献之间的引证关系而形成的一种检索语 言。它以引文为检索词,根据引证关系将有关文献自然地耦合在 一起
2、2按语言受控情况对检索语言进行划分 Artificial Language是指采用 Controlled term并进行人工控制的语 言,或称受控语言。所谓规范词是指采用特定的词汇来专指或 网罗相应的概念,它们能够对同义词、近义词、相关词、多义一 词及缩略语等进行规范。使用规范词能够提高检索效率。单元 词语言、标题词语言、叙词语言等都是规范语ˉ Natura| Language是指采用 Uncontrolled term,即不加规范、不 受控制的 Free term,它们直接来自所处理的文献本身的标引用 语或检索用语,在使用前未经优选和规范化处理
6 2、2 按语言受控情况对检索语言进行划分 Artificial Language是指采用Controlled term并进行人工控制的语 言,或称受控语言。所谓规范词是指采用特定的词汇来专指或 网罗相应的概念,它们能够对同义词、近义词、相关词、多义 词及缩略语等进行规范。使用规范词能够提高检索效率。单元 词语言、标题词语言、叙词语言等都是规范语言。 Natural Language 是指采用Uncontrolled term,即不加规范、不 受控制的Free term,它们直接来自所处理的文献本身的标引用 语或检索用语,在使用前未经优选和规范化处理
2、3检索语言的谱系 一般地,可以将检索语言类型按亲属关系划分为4个层次,从而构成 检索语言的谱系。 检索语言语系检索语言语族检索语言语支检索语言语种∷ 描述文献内容分类检索语言标魎词法 特征的检索语言住题检索语言元词法 分类主题一体叙词法汉语主题词表 描述文献外在 化语言键词法 特征的检索语言 7
7 2、3 检索语言的谱系 一般地,可以将检索语言类型按亲属关系划分为4个层次,从而构成 检索语言的谱系。 检索语言语系 检索语言语族 检索语言语支 检索语言语种 描述文献内容 分类检索语言 标题词法 特征的检索语言 主题检索语言 元词法 分类主题一体 叙词法 汉语主题词表 描述文献外在 化语言 键词法 特征的检索语言
三、检索语言的构成和基本功能 1、检索语言的构成。检索语言包括两个部分:一是检索语言词江 即登录在分类表、词表中的全部标识。一个标识(分类号、检索 词、代码)就是它的一个语词,而分类表、词表、代码表则是它 的词典。二是检索语言语法,它是指如何创造和运用那些标识 来正确表达文献内容和信息需要,以有效地实现信息检索的 整套规则。检索语言语法可以进一步分为词法和句法两个方面。 2、检索语言的基本功能。 其对文献的信息知识内容及某些外部特征加以标引; 其对内容相同或相关的信息加以集中或揭示其相关性; 便于对标引用语和检索用语进行相符性比较 对大量信息加以系统化或组织化;
8 三、检索语言的构成和基本功能 1、检索语言的构成。检索语言包括两个部分:一是检索语言词汇, 即登录在分类表、词表中的全部标识。一个标识(分类号、检索 词、代码)就是它的一个语词,而分类表、词表、代码表则是它 的词典。二是检索语言语法,它是指如何创造和运用那些标识 来正确表达文献内容和信息需要,以有效地实现信息检索的一 整套规则。检索语言语法可以进一步分为词法和句法两个方面。 2、检索语言的基本功能。 对文献的信息知识内容及某些外部特征加以标引; 对内容相同或相关的信息加以集中或揭示其相关性; 对大量信息加以系统化或组织化; 便于对标引用语和检索用语进行相符性比较
四、检索语言的基本原理 1、基本原理与机制之一:概念逻辑 概念逻辑是揭示事物夲质属性及各种事物之间联系与区别的科学思 维方式,它反映概念之间的关系,确定概念的类型、内涵和外延 等。检索语言就是运用概念之间的各种关系,对文献内容和外部 特征进行标引。具体而言,概念的划分与概括,侧重于概念的隶 属关系和并列关系,并据此建立检索语言的概念等级体系。概念 的分析与综合,主要是利用概念的交叉关系,依此建立检索语言 的概念组配体系。 2、基本原理与机制之二:知识分类 知识分类是指以各门科学所研究的运动形态的固有特征及其互相关 联与转变的次序为依据,对整个科学知识领域所做的分类。目的 是考察各门科学之间的区别与联系,确定各门科学的内部结构, 建立相应的分类体系,以反映当代科技水平并指导科学的发展
9 四、检索语言的基本原理 1、基本原理与机制之一:概念逻辑 概念逻辑是揭示事物本质属性及各种事物之间联系与区别的科学思 维方式,它反映概念之间的关系,确定概念的类型、内涵和外延 等。检索语言就是运用概念之间的各种关系,对文献内容和外部 特征进行标引。具体而言,概念的划分与概括,侧重于概念的隶 属关系和并列关系,并据此建立检索语言的概念等级体系。概念 的分析与综合,主要是利用概念的交叉关系,依此建立检索语言 的概念组配体系。 2、基本原理与机制之二:知识分类 知识分类是指以各门科学所研究的运动形态的固有特征及其互相关 联与转变的次序为依据,对整个科学知识领域所做的分类。目的 是考察各门科学之间的区别与联系,确定各门科学的内部结构, 建立相应的分类体系,以反映当代科技水平并指导科学的发展
五、信息检索语言的基本要求 1、保证较高的检全率和检准率。 2、能满足多种检索要求。从学科、专业出发的族性检索, 从事物出发的特性检索,多途径、多因素检索以及检 索范围的自由改变。 3、易于标引,易于检索,减少标引和检索误差。这就需 要语词或符号的明确性,语法的严谨性,标识的直观 性,排序的易理解性,查词查号手段的多样性以及整 个语言包含概念的丰富和完备性等。 4、多方面的适应性。 5、具有与其它检索语言的兼容性和通用性 6、具有不断进行现代化改造的可能性
10 五、信息检索语言的基本要求 1、保证较高的检全率和检准率。 2、能满足多种检索要求。从学科、专业出发的族性检索, 从事物出发的特性检索,多途径、多因素检索以及检 索范围的自由改变。 3、易于标引,易于检索,减少标引和检索误差。这就需 要语词或符号的明确性,语法的严谨性,标识的直观 性,排序的易理解性,查词查号手段的多样性以及整 个语言包含概念的丰富和完备性等。 4、多方面的适应性。 5、具有与其它检索语言的兼容性和通用性。 6、具有不断进行现代化改造的可能性