4-2信息检索步骤 信息检索步骤是根据检索课题的目的和内容要求,把合 乎需要的文献或信息线索挑选岀来所遵循的一般程序。 课题分析,明确检索范围 选择检索系统和检索工具 确定检索点和检索途径 四、构造检索式 五、查找和分析检索结果 六、调整检索方案,满足检索需要 2021/2/20
2021/2/20 1 4-2 信息检索步骤 信息检索步骤是根据检索课题的目的和内容要求,把合 乎需要的文献或信息线索挑选出来所遵循的一般程序。 一、课题分析,明确检索范围 二、选择检索系统和检索工具 三、确定检索点和检索途径 四、构造检索式 五、查找和分析检索结果 六、调整检索方案,满足检索需要
课题分析,明确检索范围 1、分析检索课题的实质 学科专业范围:确定检索课题的主题及其涉及的学科专业范围; 时间范围:确定该课题需要检索资料的年代范围; 语种范围:确定该课题需要检索资料的语言文种; ■文献类型:文献媒体、出版类型等; 地理范围:确定该课题需要哪些国家或地区的资料; 查新、查准和查全等指标要求。 、机检服务单 Literature Search Request Computer Search Service -User Search Questionnaire 2021/2/20
2021/2/20 2 一、课题分析,明确检索范围 1、分析检索课题的实质 ◼ 学科专业范围:确定检索课题的主题及其涉及的学科专业范围; ◼ 时间范围:确定该课题需要检索资料的年代范围; ◼ 语种范围:确定该课题需要检索资料的语言文种; ◼ 文献类型:文献媒体、出版类型等; ◼ 地理范围:确定该课题需要哪些国家或地区的资料; ◼ 查新、查准和查全等指标要求。 2、机检服务单 ◼ Literature Search Request ◼ Computer Search Service –User Search Questionnaire
、选择检索系统和检索具 信息检索系统:指利用一定的设备和方法从文献、事实或数值记录 集合中查找所需要的信息的系统。它由检索语言、技术手段和信息数 据库组成。 、检索系统的具体分析: 从内容和时间上,考察检索系统和数据库对课题的覆盖面和一致性 从手段和技术上,考察手检和机检的结合 ■从价格和可获取性上,选择价格低廉、容易获取的检索系统和数据库。 3、选择检索系统和检索工具: 《数据库指南》和《中国数据库大全》 Guide to the reference books: E P. Sheehy编辑、美国图书馆学会出版, 介绍约14000多种工具书,是目前世界上主要的指导使用工具书的工 具书 机检系统特定的索引数据库。 2021/2/20
2021/2/20 3 二、选择检索系统和检索工具 1、信息检索系统:指利用一定的设备和方法从文献、事实或数值记录 集合中查找所需要的信息的系统。它由检索语言、技术手段和信息数 据库组成。 2、检索系统的具体分析: ◼ 从内容和时间上,考察检索系统和数据库对课题的覆盖面和一致性。 ◼ 从手段和技术上,考察手检和机检的结合。 ◼ 从价格和可获取性上,选择价格低廉、容易获取的检索系统和数据库。 3、选择检索系统和检索工具: ◼ 《数据库指南》和《中国数据库大全》 ◼ Guide to the Reference Books:E·P·Shechy编辑、美国图书馆学会出版, 介绍约14 000多种工具书,是目前世界上主要的指导使用工具书的工 具书。 ◼ 机检系统特定的索引数据库
确定检索点和检索途经 Access point是用以排列与存取文献或记录的数据单元。包括反映文献 信息内容特征的检索点和反映文献外部特征的检索点两种。检索 点是检索的入口,也可称为检索途径。最基本的检索途径有: 1、分类检索途径。根据文献信息所属的学科专业特征及其在特定知 识分类体系中的特定位置查寻文献信息的检索途径。 主题检索途径。根据文献信息的主题特征和主题词的字顺次序査 寻信息的检索途径。 3、名称检索途径。按文献的题名特征査找文献的检索途径 4、著者检索途径。根据文献的责仼者特征査寻文献的检索途径。著 者目录、著者索引、机构索引、合同户索引、专利权人索引、著 者所在单位索引等都是按责任者名称字顺编排的 号码检索途径。根据文献的序号或代码査寻文献的检索途径 6、引文检索途径。根据文后参考文献或引用文献的特征查找相关文 献的途径。 2021/2/20
2021/2/20 4 三、确定检索点和检索途径 Access point是用以排列与存取文献或记录的数据单元。包括反映文献 信息内容特征的检索点和反映文献外部特征的检索点两种。检索 点是检索的入口,也可称为检索途径。最基本的检索途径有: 1、分类检索途径。根据文献信息所属的学科专业特征及其在特定知 识分类体系中的特定位置查寻文献信息的检索途径。 2、主题检索途径。根据文献信息的主题特征和主题词的字顺次序查 寻信息的检索途径。 3、名称检索途径。按文献的题名特征查找文献的检索途径。 4、著者检索途径。根据文献的责任者特征查寻文献的检索途径。著 者目录、著者索引、机构索引、合同户索引、专利权人索引、著 者所在单位索引等都是按责任者名称字顺编排的。 5、号码检索途径。根据文献的序号或代码查寻文献的检索途径。 6、引文检索途径。根据文后参考文献或引用文献的特征查找相关文 献的途径
四、检索式的构造 在手式检索时,每次检索只有从一个检索点出发,而且只能选 择其中的一个属性值,检索范围比较窄。而机检系统适应多 点、多属性值检索,对课题所涉及的方方面面,对包含的多 种概念或多种限定都可以做出相应的处理,检索结果的精确 度高。但是,计算机检索需要制订一个可执行的方案,这就 是检索式的构造,它是检索策略的具体表现 1、检索式 2、检索式构造方法 3、检索式构造技巧 2021/2/20
2021/2/20 5 四、检索式的构造 在手式检索时,每次检索只有从一个检索点出发,而且只能选 择其中的一个属性值,检索范围比较窄。而机检系统适应多 点、多属性值检索,对课题所涉及的方方面面,对包含的多 种概念或多种限定都可以做出相应的处理,检索结果的精确 度高。但是,计算机检索需要制订一个可执行的方案,这就 是检索式的构造,它是检索策略的具体表现。 1、检索式 2、检索式构造方法 3、检索式构造技巧
1、猃索式 检索式是表达用户提问要求的逻辑算式,它将各检索单元(其中 最多的是能表达主题内容的检索词)之间的逻辑关系、位置关系 等用检索系统规定的各种操作符连接起来,成为机器可识别和执 行的命令形式。通常由检索条件、检索词、布尔逻辑运算符、表 运算优先级的括号、结束号等组成 检索词是标引和检索文献时用以表达一定概念的语词或其他符号, 是构成检索式的最基本单元。包括描述文献外表特征的词和文献 内容特征的词两个范畴,涉及规范词、规范化的代码和自由词3 种形式。检索词应满足匹配的要求 检索词选择的基本原则:(1)主题词优先原则:(2)自由词适度原 则;(3)基本词组配原则。总之,检索词应当具有全面性、专指 性和一致性,尽可能切合检索课题,并对检索课题的实质做岀全 面、准确的描述 2021/2/20
2021/2/20 6 1、检索式 ◼ 检索式是表达用户提问要求的逻辑算式,它将各检索单元(其中 最多的是能表达主题内容的检索词)之间的逻辑关系、位置关系 等用检索系统规定的各种操作符连接起来,成为机器可识别和执 行的命令形式。通常由检索条件、检索词、布尔逻辑运算符、表 示运算优先级的括号、结束号等组成。 ◼ 检索词是标引和检索文献时用以表达一定概念的语词或其他符号, 是构成检索式的最基本单元。包括描述文献外表特征的词和文献 内容特征的词两个范畴,涉及规范词、规范化的代码和自由词3 种形式。检索词应满足匹配的要求。 ◼ 检索词选择的基本原则:(1)主题词优先原则;(2)自由词适度原 则;(3)基本词组配原则。总之,检索词应当具有全面性、专指 性和一致性,尽可能切合检索课题,并对检索课题的实质做出全 面、准确的描述
2、检索式构造力法 检索式构造方法是指对检索课题进行分析,选好检索词之后,使用系统 规定的布尔算符及其他联系符号,按检索词之间的关系构造检索表达 式的方法。 聚类组合法:是指对检索课题名称按序实施切分、删除、替换、聚类 补充、增加、组合等操作,从而生成检索式的方法 (1)切分:把代表检索课题的语句以词或词组为单位进行划分。 (2)删除:对经过切分后的检索语句中的不适宜作为检索词的词进行删除 (3)替换:对表达欠佳的词汇进行替换 (4)聚类:对切分出来的单元按语义进行同类合并 (5)补充:补充与原来的检索用词相关、相似或相同的各种词汇。 (6)增加:采用逻辑与或逻辑非的方式对一词多义的情况进行限定 ⑦)组合:将检索用词按照检索课题的需要进行组合,以形成检索式。 2021/2/20
2021/2/20 7 2、检索式构造方法 检索式构造方法是指对检索课题进行分析,选好检索词之后,使用系统 规定的布尔算符及其他联系符号,按检索词之间的关系构造检索表达 式的方法。 聚类组合法:是指对检索课题名称按序实施切分、删除、替换、聚类、 补充、增加、组合等操作,从而生成检索式的方法。 ⑴ 切分:把代表检索课题的语句以词或词组为单位进行划分。 ⑵ 删除:对经过切分后的检索语句中的不适宜作为检索词的词进行删除。 ⑶ 替换:对表达欠佳的词汇进行替换。 ⑷ 聚类:对切分出来的单元按语义进行同类合并。 ⑸ 补充:补充与原来的检索用词相关、相似或相同的各种词汇。 ⑹ 增加:采用逻辑与或逻辑非的方式对一词多义的情况进行限定。 ⑺ 组合:将检索用词按照检索课题的需要进行组合,以形成检索式
3、检索式构造技巧 3、1布尔检索:利用布尔代数中的逻辑算符,即在信息检索中能够表 达概念之间关系的一类运算符AND、OR、NOT等进行检索词语或代 码的逻辑组配,以进行检索的一种方法和技术。 3、2词索:指计算机检索时,利用检索词的词干或不完整词形进 行査找的检索技巧。它实际上是使用通配符或截词符来进行的模糊 检索。截词检索可以分后截断、前截断和中截断3种方式 3、3限制检索:在检索系统中,通常采用一些缩小或约束检索结果的 方法。限制检索主要利用系统规定的限制符、限制命令或限制字段 进行的。其中,字段检索是限定检索词在数据库记录中出现的字段 范围的一种检索方法。在检索系统中,数据库设置和提供的可供检 索的字段分为主题字段和非主题字段两大类。题名(T)、叙词(DE) 标识词(ID)和文摘(AB)等是主题字段;作者(AU)、文献类型(DT) 语种(LA)、出版年代(PY)等是非主题字段。字段检索时,可以利用 后缀符对主题字段进行限制,利用前缀符对非主题字段加以限制。 2021/2/20
2021/2/20 8 3、检索式构造技巧 3、1 布尔检索:利用布尔代数中的逻辑算符,即在信息检索中能够表 达概念之间关系的一类运算符AND、OR、NOT等进行检索词语或代 码的逻辑组配,以进行检索的一种方法和技术。 3、2 截词检索:指计算机检索时,利用检索词的词干或不完整词形进 行查找的检索技巧。它实际上是使用通配符或截词符来进行的模糊 检索。截词检索可以分后截断、前截断和中截断3种方式。 3、3 限制检索:在检索系统中,通常采用一些缩小或约束检索结果的 方法。限制检索主要利用系统规定的限制符、限制命令或限制字段 进行的。其中,字段检索是限定检索词在数据库记录中出现的字段 范围的一种检索方法。在检索系统中,数据库设置和提供的可供检 索的字段分为主题字段和非主题字段两大类。题名(TI)、叙词(DE)、 标识词(ID)和文摘(AB)等是主题字段;作者(AU)、文献类型(DT)、 语种(LA)、出版年代(PY)等是非主题字段。字段检索时,可以利用 后缀符对主题字段进行限制,利用前缀符对非主题字段加以限制
Boolean search 操作符逻辑关系国示 表达式的含义 AORB逻辑或 字段值满足A或B或同时包括两者 AB 扩大检索范围,增加全面性 AAND B逻辑与 字段必须同时满足A和B。缩小检 AB 索范围,增加专指性 A NOT B逻辑非 字段值只包含A,不包含B或同时 AB 含有A和B的信息。排除不希望出 现的概念,增加准确性 A XOR B逻辑异或 命中信息包含A,也包含B,但不 (B 包含同时含有A和B的信息 2021/2/20
2021/2/20 9 Boolean Search 操作符 逻辑关系 图示 表达式的含义 A OR B 逻辑或 字段值满足A或B或同时包括两者。 扩大检索范围,增加全面性。 A AND B 逻辑与 字段必须同时满足A和B。缩小检 索范围,增加专指性。 A NOT B 逻辑非 字段值只包含A,不包含B或同时 含有A和B的信息。排除不希望出 现的概念,增加准确性。 A XOR B 逻辑异或 命中信息包含A,也包含B,但不 包含同时含有A和B的信息。 A B A B A A B B
Truncation Search 前-后-中截断 截断位置前截断 后截断 中截断 检索式 .magnetic Market? Organi?ation 检索 Magnetic Market Organisation 结果 Electro-magnetic Marketable Organization Thero-magnetic Marketin 有限-无限截断 ①??表示后截断至多1个字符; ②??表示后、中截断至多3个字符 ③?加在一个检索词根后表示无限截断。 2021/2/20
2021/2/20 10 Truncation Search ◼ 前-后-中截断 ◼ 有限-无限截断 ① ? ?表示后截断至多1个字符; ② ???表示后、中截断至多3个字符; ③ ?加在一个检索词根后表示无限截断。 截断位置 前截断 后截断 中截断 检索式 ?magnetic Market? Organi?ation 检索 结果 Magnetic Electro-magnetic Thero-magnetic …… Market Marketable Marketing …… Organisation Organization ……