深圳大学图书馆 1983 Shenzhen University Library 第三章 社科信息检索原理与技术 The Principles and technology of Social sciences Information Retrieval 深圳大学图书馆 2017年9月
目录页 °的常 Contents pau 信检索原理 第二书》信息检索语言 年>信息检索技术
目录页 Contents Page 第一节 信息检索原理 第二节 第三节 信息检索语言 信息检索技术
第一节信息检索原理 °的常 基本概念 信息检索原理就是用户将信息需求转变为检索系统所能识别的检索标识,与 信息检索系统中存储的信息特征进行逐-比对,两者完全—致或基本一致时, 即为检索命中信息,可按用户要求从检索系统中输出 其检索结果既可能是用户需要的最终信息(一次信息),也可能是用户需要的信 息线索(二次信息),用户可据此线索进一步进行判断、筛选,以获取所需要的 最终信息
第一节 信息检索原理 n 信息检索原理就是用户将信息需求转变为检索系统所能识别的检索标识,与 信息检索系统中存储的信息特征进行逐一比对,两者完全一致或基本一致时, 即为检索命中信息,可按用户要求从检索系统中输出。 n 其检索结果既可能是用户需要的最终信息(一次信息),也可能是用户需要的信 息线索(二次信息),用户可据此线索进一步进行判断、筛选,以获取所需要的 最终信息。 基本概念
第一节信息检索原理 °的常 信息检索原理图 存储次分析|信息 检 标引信息特输入信 过程信息 特征 标识 息 索 检索工具 输入 检索结果 检索|检索[分析检索 过程|课题 言标引检索提间检索 提问 标识
信息检索原理图 第一节 信息检索原理
第一节信息检索原理 °的常 只 概念解释 文献信息存储过程: 将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些 文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。 ■标引: 对文献内容特征和外部特征进行分析形成概念标识,再依据定的标准或规则 (检索语言:如分类号、主题词、关键词及著者选用规则等)将其用相应的标识充分、准确地表达出来。 文献信息检索过程: 用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言 将拟定的检索提问规范成检索标识,用于检索的过程
概念解释 n 文献信息存储过程: 将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些 文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。 n 标引: 对文献内容特征和外部特征进行分析形成概念标识,再依据一定的标准或规则 (检索语言:如分类号、主题词、关键词及著者选用规则等)将其用相应的标识充分、准确地表达出来。 n 文献信息检索过程: 用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言) 将拟定的检索提问规范成检索标识,用于检索的过程。 第一节 信息检索原理
第二节信息检索语言 °的常 只 念说明 ■检索语言就是信息组织和信息检索时所使用的语言(包括自然语言)。 ■信息检索语言是文献信息标引的规则和标准,标引人员可用它来标引文献以便将文献整理、 加工、存储于检索系统中,同时,检索人员可用它来表达检索课题信息的内容,以便把特定 文献从检索系统中检索出来 ■因此,检索语言就是一种把文献的存储与检索联系起来,把标引人员和检索人员沟通起来的 约定人工语言
第二节 信息检索语言 n 检索语言就是信息组织和信息检索时所使用的语言(包括自然语言)。 n 信息检索语言是文献信息标引的规则和标准,标引人员可用它来标引文献以便将文献整理、 加工、存储于检索系统中,同时,检索人员可 用它来表达检索课题信息的内容,以便把特定 文献从检索系统中检索出来。 n 因此,检索语言就是一种把文献的存储与检索联系起来,把标引人员和检索人员沟通起来的 约定人工语言。 概念说明
第二节信息检索语言 °的常 主要功能 ①对文献的信息内容及其外表特征加以规范化的标引 ■②对内容相同及相关的文献信息加以集中或揭示其相关性; ■③可使文献信息的存储集中化、系统化、组织化,便于检索者按一定的排列次序进行 有序化检索 ■④便于将标引用语和检索用语进行相符性比较 ■⑤最高全准率保证检索者按不同需要检索文献时,都能获得最高查全率和查准率
n ①对文献的信息内容及其外表特征加以规范化的标引; n ②对内容相同及相关的文献信息加以集中或揭示其相关性; n ③可使文献信息的存储集中化、系统化、组织化,便于检索者按一定的排列次序进行 有序化检索; n ④便于将标引用语和检索用语进行相符性比较; n ⑤最高全准率:保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。 主要功能 第二节 信息检索语言
第二节信息检索语言 °的常 检索语言在检索中的作用 信息|原始特征分析、批出标引信L、刻 存|信息 念标识 息 标识广卷索 检 索 检索 信息检索需求分折、拟出检检索语 检索 检索结果 趁索儿爵求 索标识 卡系统
检索语言在检索中的作用 第二节 信息检索语言
第二节信息检索语言 °的常 只 如:有三篇文献篇名如下: Xi1: A Model of multimedia information retrieval Xi2: The Information retrieval in chemistry www server 文献3: ERIC resources 在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言对其进行标引,标引结果为 文献1:篇名 title): A Model of multimedia information retrieval EA(subject): information retrieval, multimedia computer applications ■文献2:篇名 (title): The Information retrieval in chemistry Www server 主题( ( subject): chemistry, educational materials 文献3:篇名( title): ERIC resources 主题( subject): educational materials 标引后这三篇文献分别被存储进数据库
n 文献1:A Model of multimedia information retrieval n 文献2:The Information retrieval in chemistry WWW server n 文献3:ERIC resources 例如:有三篇文献篇名如下: 在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言对其进行标引,标引结果为: n 文献1:篇名(title): A Model of multimedia information retrieval 主题(subject): information retrieval, multimedia computer applications n 文献2:篇名(title): The Information retrieval in chemistry WWW server 主题(subject): chemistry, educational materials n 文献3:篇名(title): ERIC resources 主题(subject): educational materials 标引后这三篇文献分别被存储进数据库 第二节 信息检索语言
第二节信息检索语言 °的常 在信息检索过程中 ■如果用户输入" information retrieval"一词,并将检索范围限定在篇名中,则文献1与文献2 符合用户要求,成为检索结果 ■如果用户输入" information retrieval"-词,并将检索范围限定在主题中,则只有文献1符合 用户要求,成为检索结果 ■如果用户输入" educational materials"一词,并将检索范围限定在主题中,则文献2和文献3 符合用户要求,成为检索结果 在上述例子中," information retrieval"、" educational materials”都是检索语言,篇名和主题则 是检索语言的标识,检索系统就是通过他们将用户需求与信息内容进行运算匹配,最终找到检索结果的。 由这个例子可以看出,检索语言的主要作用就是对文献的外部特征和内容进行多层次描述, 提供多种检索途径,以方便用户从不同角度检索查找
n 如果用户输入“information retrieval”一词,并将检索范围限定在篇名中,则文献1与文献2 符合用户要求,成为检索结果。 n 如果用户输入“information retrieval”一词,并将检索范围限定在主题中,则只有文献1符合 用户要求,成为检索结果。 n 如果用户输入“educational materials”一词,并将检索范围限定在主题中,则文献2和文献3 符合用户要求,成为检索结果。 在信息检索过程中: 在上述例子中,“information retrieval”、“educational materials”都是检索语言,篇名和主题则 是检索语言的标识,检索系统就是通过他们将用户需求与信息内容进行运算匹配,最终找到检索结果的。 由这个例子可以看出,检索语言的主要作用就是对文献的外部特征和内容进行多层次描述, 提供多种检索途径,以方便用户从不同角度检索查找。 第二节 信息检索语言