当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

北京大学:《信息组织 Information Organization》课程教案讲义_主题标引

资源类别:文库,文档格式:PDF,文档页数:10,文件大小:301KB,团购合买
第一节 主题标引的概述 第二节 主题分析 第三节 主题标引规则 第四节 主题检索工具
点击下载完整版文档(PDF)

第一节主题标引的概述 第七章主题标引 第一节主题标引的概述 1.主题标引的意义 第二节主题分析 2.主题标引方式 第三节主题标引规则 第四节主题检索工具 1.主题标引的意义 2.标引方式 主题标引—一是依据一定的主题词表或主题标 标引方式是根据文献特点和使用需 规则,赋予文献语词标识的过程。分为受控标 要确定的标引和揭示文献主题的形式 引和自由标引两种 受控标引—依据词表为工具,使用经过控制的 整体标引 语词标识进行标引,目前国内主要使用叙词法。 全面标引 对口标引 自由标引不依据词表,由标引人员根据文献 综合标引 内容,直接用自然语言中的语词进行标引。 分析标引 2标引方式—体标引 2标引方式—全面标引 亦称浅标引,是一种概括揭示文献基 本主题内容的标引 全国标引亦称深标引是种充分揭示文就论及的所 有有检价值的主题念的标引。 例:《信息管理板论》标引为:信息管理 《我国能派结构和大气环境污染 《汽车与拖拉机液压传动系统》 能源、消贵结构、烟污染、空气污 标引为:汽车—液压传动系统 技术、煤、环保护中国、环策 适用于手检系统。一般予1一2个分类号,2 8个标引词 用结合机检系统处理论文、技术报告等:主题词的标引 数量常在5—20个主右

1 第七章 主题标引 第一节 主题标引的概述 第二节 主题分析 第三节 主题标引规则 第四节 主题检索工具 第一节 主题标引的概述 1. 主题标引的意义 2. 主题标引方式 1. 主题标引的意义 主题标引——是依据一定的主题词表或主题标引 规则,赋予文献语词标识的过程。分为受控标 引和自由标引两种。 受控标引——依据词表为工具,使用经过控制的 语词标识进行标引,目前国内主要使用叙词法。 自由标引——不依据词表,由标引人员根据文献 内容,直接用自然语言中的语词进行标引。 2. 标引方式 标引方式——是根据文献特点和使用需 要确定的标引和揭示文献主题的形式。 包括: – 整体标引 – 全面标引 – 对口标引 – 综合标引 – 分析标引 2.标引方式——整体标引 整体标引——亦称浅标引,是一种概括揭示文献基 本主题内容的标引。 例:《信息管理概论》 标引为:信息管理 《汽车与拖拉机液压传动系统》 标引为:汽车——液压传动系统 拖拉机——液压传动系统 适用于手检系统。一般赋予1—2个分类号,2— 8个标引词。 2.标引方式——全面标引 全面标引——亦称深标引,是一种充分揭示文献论及的所 有有检索价值的主题概念的标引。 例:《我国能源结构和大气环境污染》 全面标引为:能源、消费结构、煤烟污染、空气污 染、无污染技术、煤、环境保护、中国、环境政策、 能源构成、污染防止等 适用结合机检系统处理论文、技术报告等;主题词的标引 数量通常在5—20个左右

2标引方式—对口标引 2标引方式—综合标引 对口标引亦称重点标引,是一种只揭示 综合标引—是一种以集合型信息资源的整 文献中适合本专业需要的主题内容的标引 体为单位进行的橛括性标引。 例如:《汽车与拖拉机液压传动系统》汽车 制造文献部门可只标引 般应根据情况对文献类型进行必要的揭示。 汽车—液压传动系统 例如:《机械设计丛书》 适用专业文献单位 标引为:机械设计一丛书 2标引方式——分析标引 第二节主题分析 分析标引是一种根据信息资源中部分 主题分析—指根据文献标引和检索的需要, 片段或集合型信息资源的构成单元进行 对文献主题内容进行分析,提炼主题概 念的过程。 通常要求掌握对文献主题类型、主题结构 例如:对《西行漫记》一书中毛泽东 的基本分析方法,在充分把握文献主题 生平的内容加以揭示。 对象及其构成因素的基础上,对主题概 念进行提炼和取舍,确定待标概念。 1.文献主题类型分析 1.文献主题类型分析 按主题数量 常见联结主题类型 单主题。如,汽车、汽车发动机、网络安 全检测 应用关系:计算机在图书馆的应用 多主题。 比较关系:分类法与主题法的比较 并列关系主题,如,汽车和拖拉机的维修 影响关系:气候对农业生产的影响等 从属关系主题,如,物理学和固体物理学 因果关系。经济改革对人们价值观的冲击 联结主题。指两或多个主题对象之间根据 倾向关系。供社会科学研究使用的数学方 定的联系所形成的一种主题类型。常见的有 应用关系、比较关系、影响关系等

2 2.标引方式——对口标引 对口标引——亦称重点标引,是一种只揭示 文献中适合本专业需要的主题内容的标引。 例如:《汽车与拖拉机液压传动系统》 汽车 制造 文献部门可只标引: 汽车——液压传动系统 适用专业文献单位 。 2.标引方式——综合标引 综合标引——是一种以集合型信息资源的整 体为单位进行的概括性标引。 一般应根据情况对文献类型进行必要的揭示。 例如:《机械设计丛书》 标引为:机械设计 —丛书 2.标引方式——分析标引 分析标引——是一种根据信息资源中部分 片段或集合型信息资源的构成单元进行 的标引。 例如:对《西行漫记》一书中毛泽东 生平的内容加以揭示。 第二节 主题分析 主题分析——指根据文献标引和检索的需要, 对文献主题内容进行分析,提炼主题概 念的过程。 通常要求掌握对文献主题类型、主题结构 的基本分析方法,在充分把握文献主题 对象及其构成因素的基础上,对主题概 念进行提炼和取舍,确定待标概念。 1. 文献主题类型分析 按主题数量 • 单主题。如,汽车、汽车发动机、网络安 全检测 ; • 多主题。 – 并列关系主题,如,汽车和拖拉机的维修; – 从属关系主题,如,物理学和固体物理学; – 联结主题。指两或多个主题对象之间根据一 定的联系所形成的一种主题类型。常见的有 应用关系、比较关系、影响关系等。 1. 文献主题类型分析 常见联结主题类型: 应用关系:计算机在图书馆的应用 比较关系:分类法与主题法的比较 影响关系:气候对农业生产的影响等 因果关系。经济改革对人们价值观的冲击 倾向关系。供社会科学研究使用的数学方 法

1文献主题类型分析 1.文献主题类型分析 按照论述的重要程度 ·按主题成分 主要主题 单元主题。图书馆学;美术馆 次要主题 复合主题。图书馆藏书管理 按照与检索系统的相关程度, 专业主题 中小学教学方法研究 非专业主题 按照文献论述的直接 显性主题 隐性主题等 2.分析主题结构 主题分面公式 主题结构—指文献主题的基本主题因 科茨提出的显著性引用次序:事物一部件 素以及它们之间的关系。 材料一活动一施动者 分析目的,为了在查明主题构成因素 及其相互关系的基础上,对主题概 我国国家标准中提出的主题分面公式 念进行提炼。 A主体因素 A2材料、A3 分析方法:模式化分析。一般利用各 方法、A4过程、A5条件等) 国学者提出的各种主题关系的结构 B通用因素 模式,作为主题分析和确定先组式 C空间因素 主题标题的依搪 D时间因素 E文献类型因素 主题结构分析举例 3.常见主题分析误差 例一:“中国八十年代农田水利规程手册 农田水利规程中国八十年代手册 主体因素通用因素位置因素时间因素文献类型因素 主题概念提炼不足。 例二:“九十年代法国航空发动机设计” 航空发动机设计 主题概念提炼过度 法国九十年代 (主体因素)(通用因素)(位置因素)(时间因素) 提炼错误 例三:“高原桥梁混凝土施工 桥梁混凝土施工高原 Al对象A2材料A3方法位置因素

3 1.文献主题类型分析 • 按主题成分 – 单元主题。图书馆学;美术馆; – 复合主题。图书馆藏书管理、 中小学教学方法研究; 1. 文献主题类型分析 • 按照论述的重要程度, – 主要主题 – 次要主题; • 按照与检索系统的相关程度, – 专业主题 – 非专业主题; • 按照文献论述的直接 – 显性主题 – 隐性主题等。 2. 分析主题结构 主题结构——指文献主题的基本主题因 素以及它们之间的关系。 分析目的,为了在查明主题构成因素 及其相互关系的基础上,对主题概 念进行提炼。 分析方法:模式化分析。 一般利用各 国学者提出的各种主题关系的结构 模式,作为主题分析和确定先组式 主题标题的依据。 主题分面公式 • 科茨提出的显著性引用次序:事物-部件 -材料-活动-施动者。 • 我国国家标准中提出的主题分面公式: A 主体因素(A1研究对象、A2材料、A3 方法、A4过程、A5条件等) B通用因素 C空间因素 D时间因素 E文献类型因素 主题结构分析举例 例一:“中国八十年代农田水利规程手册” 农田水利 规程 中国 八十年代 手册 主体因素 通用因素 位置因素 时间因素 文献类型因素 例二: “九十年代法国航空发动机设计” 航空发动机 设计 法国 九十年代 (主体因素)(通用因素)(位置因素)(时间因素) 例三:“高原桥梁混凝土施工” 桥梁 混凝土 施工 高原 A1对象 A2 材料 A3 方法 位置因素 3. 常见主题分析误差 • 主题概念提炼不足。 • 主题概念提炼过度。 • 提炼错误

第三节主题标引规则 1.查词规则 ②选取最专指的叙词标引 主题标引的基本规则 (3)组配标引 (4)上位叙词标引 1.主题标引的查词规则 (⑤词标引。 2.主题标引的组配规则 (6)增词标引。 二.各种主题、信息资源类型标引规 自由词标引 标引数量:一般每种图书的标引词 则 数量保持在1—8个之间,机检 系统主题词数量可适当增加 2.组配标引规则 2.组配标引规则 将两个或两个以上叙词按照一定的逻辑关系结合 在一起,表达文献主题,称为组配标引。包括 限定组配是以表示事物的叙词和表示事物 特称、属性、方面的叙词进行组配,表 交叉组配和限定组配 个新的专指概念,通常以符号“”或 交叉组配是指选用若干个具有交叉关系的叙词进 为组配标识 行组配,表达一个复合的子概念,通常以符号 “:”为组配标识。例: 限定组配类型包括 “动物遗传学”标引为:动物学:遗传学。 ①特称限定组配 因际铁路联运”标引为:铁路运输:国际运输: ②方面限定组配 联合运输。 ③说明语限定组配 ④联结组配 2.组配标引规则 2.组配标引规则 ①带称限定组,表示一物与它的部分概念之间的组陀 为:机车发电机; (1)叙词的组配必须是概念组配,而不是字面组配 组配。表示物与其方面念之间 (2)叙词的组配应优先采用交叉组配。例 植物生态学标引为:植物学:生态学 不标引为:植物一生态学 以是叙词政自然语言。例如 天然气燃料的汽车标为:汽车,用天然气燃料的 柴油机维修标引为:柴油机一维修 ④联結组配。衰示事物与其具有联皓关系的事物关系的组配 (3)叙词的组配不能越级。可以用相应专指叙词组 例如:气候对农业的影响标弓 时,不得使用该词的上位词或下位词进行组

4 第三节 主题标引规则 一. 主题标引的基本规则 1. 主题标引的查词规则 2. 主题标引的组配规则 二. 各种主题、信息资源类型标引规 则 1. 查词规则 ⑴用正式叙词标引。 ⑵选取最专指的叙词标引。 ⑶组配标引。 ⑷上位叙词标引 。 ⑸靠词标引。 ⑹增词标引。 ⑺自由词标引。 标引数量:一般每种图书的标引词 数量保持在1—8个之间,机检 系统主题词数量可适当增加。 2. 组配标引规则 将两个或两个以上叙词按照一定的逻辑关系结合 在一起,表达文献主题,称为组配标引。包括: 交叉组配和限定组配。 交叉组配是指选用若干个具有交叉关系的叙词进 行组配,表达一个复合的子概念,通常以符号 “:”为组配标识。例: “动物遗传学” 标引为:动物学:遗传学。 “国际铁路联运”标引为:铁路运输:国际运输: 联合运输。 2. 组配标引规则 限定组配是以表示事物的叙词和表示事物 特称、属性、方面的叙词进行组配,表示 一个新的专指概念,通常以符号“—”或 “,”为组配标识。 限定组配类型包括: ①特称限定组配。 ②方面限定组配。 ③说明语限定组配。 ④联结组配。 2. 组配标引规则 ①特称限定组配。表示一事物与它的部分概念之间的组配。 例如: 机车发电机 标为:机车—发电机; ②方面限定组配。表示一事物与其方面概念之间的组配。包 括:材料、性质、现象状态、工艺、理论、地区、时代文 献类型等。例如:铝金属板 标为:铝—金属板 ③说明语限定组配。用于对事物作补充说明,表示事物的性 质、特征等,说明语可以是叙词或自然语言。例如: 天然气燃料的汽车 标为:汽车,用天然气燃料的 ④联结组配。表示事物与其具有联结关系的事物关系的组配。 例如:气候对农业的影响 标引为:气候—影响—农业 2. 组配标引规则 ⑴叙词的组配必须是概念组配,而不是字面组配。 ⑵叙词的组配应优先采用交叉组配。例: 植物生态学 标引为: 植物学:生态学 不标引为:植物—生态学 柴油机维修 标引为:柴油机—维修 ⑶叙词的组配不能越级。可以用相应专指叙词组配 时,不得使用该词的上位词或下位词进行组配

2.组配标引规则 2.组配标引规则 (4)必须选用与文就主题关系最密切的叙词进行組配 5叙词组配的结果必须明确,具有单义性,一义 例,主题“飞机结构设计”的相关叙词组配形 飞机一结构一设计 法加以处理。如,“工业一橡胶”直接用“工业橡 飞机结构一设计 6)并列多主题文就 飞机一结构设计 用分组组配 飞机结构结构设计 例,主题“海底采煤机被”的相关叙词组配形式 洪水一长江流域 海底采煤采煤机械 干早一华北平原 果煤机械:海底采矿设备 在机检系统中,则可使用联号,标引为 采煤机械:水采机械 长江流域 海底采煤一水采机械 2.组配标引规则 2.组配标引规则 7)一标题中的叙 可按主体因素、通用 因素、空间因素、时间因素、文献类型因素 题中多个主体因素的叙词,可按对象、 的次序排列 材料、操作、工具的次序序列 例,主题“计算机系统对高层建筑控制”, 如“中国80年代汽车工业规划研究文集”的标引 可标引为: 次序为 高层建筑一计算机控制一计算机系统 汽车工业一规划一中国1980-1989—文 如何使用示波器检测收音机”的标引次 收音机检测示波器 轮排模式 2.组配标引规则 (8)关于式。国内采用轮替法轮排: (9)标引的级别通常保持在三级以下 DABC 般不超过五级。 例:电子计算机硬盘生产工艺 碳微盘一电子计算机生产工艺 每种文献的标题数量一般应保持在四个以 使用“:”、“,”连接的主题词,轮排中随原连接的词移动 下 例:小说语言学:学 些进行深度标引的系统可提供适当供后 语言学:美学一小 组检索的词。 联结主题的轮排,必要时对连接词应作适当调整。(见教材 269页)

5 2. 组配标引规则 ⑷必须选用与文献主题关系最密切的叙词进行组配。 例,主题“飞机结构设计” 的相关叙词组配形式: 飞机—结构—设计 飞机结构—设计 飞机—结构设计 飞机结构—结构设计 例,主题“海底采煤机械”的相关叙词组配形式: 海底采煤—采煤机械 采煤机械:海底采矿设备 采煤机械:水采机械 海底采煤—水采机械 2. 组配标引规则 ⑸叙词组配的结果必须明确,具有单义性。二义 性组配,应通过明确词序或采用增词标引的方 法加以处理。如,“工业-橡胶”直接用“工业橡 胶”。 ⑹并列多主题文献,可采用分组组配,以联系符 号揭示联系。如:“长江流域洪水和华北平原干 旱” 可标引为: 洪水─长江流域 干旱-华北平原 在机检系统中,则可使用联号,标引为: 洪水 1 长江流域 1 干旱 2 华北平原 2 2. 组配标引规则 (7)一标题中的叙词,可按主体因素、通用 因素、空间因素、时间因素、文献类型因素 的次序排列。 如“中国80年代汽车工业规划研究文集”的标引 次序为: 汽车工业—规划—中国—1980-1989—文 集 2. 组配标引规则 一标题中多个主体因素的叙词,可按对象、 材料、操作、工具的次序序列。 例,主题“计算机系统对高层建筑控制”, 可标引为: 高层建筑-计算机控制-计算机系统 “如何使用示波器检测收音机”的标引次 序为: 收音机—检测—示波器 轮排模式 (8)关于轮排模式。国内采用轮替法轮排 : A B C D B A C D C A B D D A B C 例:电子计算机—硬磁盘—生产工艺 硬磁盘—电子计算机—生产工艺 使用“:”、“,”连接的主题词,轮排中随原连接的词移动。 例: 小说—语言学:美学 语言学:美学—小说 美学:语言学—小说 联结主题的轮排,必要时对连接词应作适当调整。 (见教材 269页) 2. 组配标引规则 (9)标引的级别通常保持在三级以下,一 般不超过五级。 每种文献的标题数量一般应保持在四个以 下。 一些进行深度标引的系统可提供适当供后 组检索的词

二.各种主题、文献类型的标引 2多主题文献的标引 1单主题文就的标引 2多主题文献的标引包括联结主题标引 并列主文献应根据论述的主题对象分组标引,并 列主题的数量超过四个时,使用上位叙词标引 3论及地区、时代文献的标引 4传记文就的标引 《几童疾病与保健》标引为:婴幼儿一保健 5文艺文献的主题标引 小儿疾病一常见病治疗 6丛书、多卷书、论文集的主题标引 7.百科全书、年鳖、手册、诃典的主题标引 《粮食作物虫謇防止》(玉米、大豆、小麦、谷子 8目录、素引的主题标引 标引为:禾谷类作物一病虫害防止方 9特种文就和非书资料的主题标引 2多主题文献的标引 2.多主题文献的标引 从属关系主题的文献,凡同时论述大主题和 (3)联结主题,按主题关系类型进行主题标引,并轮 小主题时,应分别对论述主题分组标引。例 关系主题的文献,一般以应用到的主题作主标题 《网络安全与黑客》 《运筹学在钫织工业中的应用】 标引为:计算机网络一安 标引为:运学一应用一鲂织T业 幼织工业一应用一运筹学 《激光在医学和生物学中的应用》 《分子生物学与基因工程》 标引为:医学一激光应用 标引为:分子生物学 生物学一激光应用 激光应用一医学 基因工程 2.多主题文献的标引 2多主题文献的标引 比较关系主题的文献,一般应以文献论述重点为主标 表示主题之间相互关系的联主题,均以其点论述 题,并加以轮排。例如 的一方作主标厦,以另方作副标,并进行轮排 《普通话与方言 标引为:普還话一比较汉语方言 《学与少民族思想文化》 汉语方言一比较普還话 标引为:儒家一关系一少激民族民族文化 少民族民族文化关系一儒家 影响取因果关系主题的文献,一般应以被影响或表示 结果的主题作主标题,并加以轮排。例如 《归纳逻舞与人工智能 《气候变迁对我国农业影响的研究》 标引为:归纳是舞关系一人工智能 标引为:农业一中国影响因素气候变化 人工智能关系一归纳一逻辑 气候变化影响农业中国

6 二. 各种主题、文献类型的标引 1.单主题文献的标引 2.多主题文献的标引(包括联结主题标引) 3.论及地区、时代文献的标引 4.传记文献的标引 5.文艺文献的主题标引 6.丛书、多卷书、论文集的主题标引 7.百科全书、年鉴、手册、词典的主题标引 8.目录、索引的主题标引 9.特种文献和非书资料的主题标引 2.多主题文献的标引 并列主题文献应根据论述的主题对象分组标引,并 列主题的数量超过四个时,使用上位叙词标引。 例: 《儿童疾病与保健》标引为:婴幼儿—保健 小儿疾病—常见病治疗 《粮食作物虫害防止》(玉米、大豆、小麦、谷子、 水稻等) 标引为:禾谷类作物—病虫害防止方 法 2.多主题文献的标引 • 从属关系主题的文献 ,凡同时论述大主题和 小主题时,应分别对论述主题分组标引。 例 如: 《网络安全与黑客》 标引为:计算机网络-安全 黑客 《分子生物学与基因工程》 标引为:分子生物学 基因工程 2. 多主题文献的标引 (3)联结主题 ,按主题关系类型进行主题标引,并轮排。 具体如: • 应用关系主题的文献,一般以应用到的主题作主标题, 并轮排。例: 《运筹学在纺织工业中的应用》 标引为:运筹学-应用-纺织工业 纺织工业-应用-运筹学 《激光在医学和生物学中的应用》 标引为:医学-激光应用 生物学-激光应用 激光应用-医学 激光应用-生物学 ⒉ 多主题文献的标引 • 比较关系主题的文献,一般应以文献论述重点为主标 题,并加以轮排。例如: 《普通话与方言》 标引为:普通话—比较—汉语方言 汉语方言—比较—普通话 • 影响或因果关系主题的文献,一般应以被影响或表示 结果的主题作主标题,并加以轮排。例如: 《气候变迁对我国农业影响的研究》 标引为:农业—中国—影响因素—气候变化 气候变化—影响—农业—中国 ⒉多主题文献的标引 • 表示主题之间相互关系的联结主题,均以其重点论述 的一方作主标题,以另一方作副标题,并进行轮排。 例如: 《儒学与少数民族思想文化》 标引为:儒家—关系—少数民族—民族文化 少数民族—民族文化—关系—儒家 《归纳逻辑与人工智能》 标引为:归纳—逻辑—关系—人工智能 人工智能—关系—归纳-逻辑

2多主题文献的标引 3关于涉及地区对象文献的标引 向关系主文就指根捐一定读者需罢角度论述 以论述对象为主标题,以读着成论述 (1)论述一地区全面情况的文献,以地区主题词 角度为副标晨进行组配标引。例如 作主标题标引,必要时进行轮排。例如: 标引为:英语,旅游用 个复杂主题文就,按限主题类型和涉及的各个主题 巴勒斯坦一地理 象,分别进行组配标引。例如 地理一巴勒斯坦 制论、信息论、系统科学与哲学》 (2)论述一地区专业领域内容的文献,以主题内 标引为:控制论关系哲学 容作主标题,以地区主题词作副标题。例如: 信息论关系一学 系统科学关系哲学 农业一英国一现代 3关于涉及地区对象文献的标引 第四节主题检索工具 按照采用的设备条件,分为: (3)确定直接标引和间接标引 手检主题工具:包括主题目录和主题索引 城市地理一广州 主题机检系统,可以是不同对象的数据库 按照组配先后,分为: 地方志一浙江一桐乡 先组式检索系统,通常需要建立标题 雕塑一罗马 后组式检索系统,通常根据检索软件的要求,按 定的机读编目格式输入,供机械检索使用 旅游指南一德国一科隆 按照是否控制,分为: 控制系统 自然语言系统 手工主题目录一以文献为中心的系统 书本式主题索引一以标识为中心的系统 信息系统一信息交换247047 城市道路 业一气候一世界 作物一气候一世界 道路网一设计301001 世界农业气候与作物气候世界农业气候与作物气候 立体交叉一标准化141007 立体交叉一结构设计141011 一工程地质图一地图制图学161020,161024 城市污水 一活性污泥处理025005 一排水一城市规划025007,025010 水处理一化学净化025003

7 ⒉多主题文献的标引 • 倾向关系主题文献,指根据一定读者需要角度论述特 定的文献,一般以论述对象为主标题,以读者或论述 角度为副标题进行组配标引。例如: 《旅游英语》 标引为:英语,旅游用 • 多个复杂主题文献,按照主题类型和涉及的各个主题 对象,分别进行组配标引。例如: 《控制论、信息论、系统科学与哲学》 标引为:控制论—关系—哲学 信息论—关系—哲学 系统科学—关系—哲学 3.关于涉及地区对象文献的标引 (1)论述一地区全面情况的文献,以地区主题词 作主标题标引,必要时进行轮排。例如: 荷兰—概况 巴勒斯坦-地理 地理-巴勒斯坦 (2)论述一地区专业领域内容的文献,以主题内 容作主标题,以地区主题词作副标题。例如: 农业—英国—现代 3.关于涉及地区对象文献的标引 (3)确定直接标引和间接标引 城市地理—广州 地方志—浙江—桐乡 雕塑—罗马 旅游指南-德国-科隆 第四节 主题检索工具 按照采用的设备条件,分为: • 手检主题工具:包括主题目录和主题索引; • 主题机检系统,可以是不同对象的数据库。 按照组配先后,分为: • 先组式检索系统,通常需要建立标题; • 后组式检索系统,通常根据检索软件的要求,按 一定的机读编目格式输入,供机械检索使用。 按照是否控制,分为: • 控制系统; • 自然语言系统, 手工主题目录—以文献为中心的系统 农业-气候-世界 世界农业气候与作物气候/ 作物-气候-世界 世界农业气候与作物气候/ 书本式主题索引—以标识为中心的系统 城市 —信息系统—信息交换 247047 城市道路 —道路网—设计 301001 —立体交叉—标准化 141007 —立体交叉—结构设计 141011 城市图 —工程地质图—地图制图学 161020,161024 城市污水 —泵站—结构设计 025004 —活性污泥处理 025005 —排水—城市规划 025007,025010 —污水处理—化学净化 025003

主题机检系统一优点 主题机检系统一一构成 ①检紫灵活。可以后组方式,通过主题词的组配,自由扩大或缩 主题机检系统通常是由各种子系统结合而 检索范围,满足各种检索需要 成的多功能的一体化系统。多数包括 ②检素方式多样.可设置多种检索方式,如布尔逻辑检索、截词 索、利用机读词表检索、采用加权等多种检索手段 索引子系统 ③获取情息亮分。可以迅速获取数据库系统中存储的有关一文献 检索子系统 息,包括文献的地址、题录、文摘,甚至原义 ④获取信息便利,可以通过系统迅速查找有关一检索对象的全部 表及各种规范文档管理子系统 通过计算机网络进行远程检索 输入输出子系统 ⑤获取信息及时。可以利用机械系统便于更新的特点,及时检出 ⑥便于检囊结果的获取。主题机械检索系统的检索结果,可根据 需要加以打印、复制或套录等各种形式输出,比手工方使 顺序文档和倒排文档 顺序文档和倒排文档 其对应的主题词倒排档为: 主文档中的文献记录的主题数据为 分类法 003,004,005 登录号标引词 调查 001信息检索叙词法调查 计算机检索002,003 002计算机检索,检索系统叙词法 进展 计算机检索,分类法,进展 检索系统002,005 联机检索,分类法 联机检索001,004 检索系统,信息检索,分类法 信息检索001,005 叙词法 受控主题机检系统的功能设置 受控主题机检系统的功能设置 (1)主题词检功能。通过输入主题词,输出命 的检索对象,命中篇数,及相关信息 (6)词典浏览功能。可通过显示词汇表,供检索参考 (2)入口词检索功能。输入与主题词具有用代关 (7)限制范國检業*。利用选择框,提供地区、时间等 系的词后,按对应的主题词输出检索结果。 (3)組配检功能。使用逻辑组配符,进行组配 (8)排序显示功能*。即根据需要对输出结果进行排列 检索,扩大或缩小检索范围,改进检索效果 (9)结合联号、职号检索。一般为以论文为检索对象 (4)综合查找功能*。可以与其他描述数据结合进 的专业数据库使用。使用职号辅助检索的系统相对较 行综合查找。例如,北大馆联机目录的“复杂检 索”可以同时结合主题、著者、题名,进行检索 (10)输出手工检素工具。包括输出书本式主题索引或 卡片式主题目录等产品,供手工检索使用 (5)浏览查找功能*。利用预先确定的标题进行浏 览查找

8 主题机检系统-优点 ①检索灵活。可以后组方式,通过主题词的组配,自由扩大或缩 小检索范围,满足各种检索需要。 ②检索方式多样。可设置多种检索方式,如布尔逻辑检索、截词 检索、利用机读词表检索、采用加权等多种检索手段。 ③获取信息充分。可以迅速获取数据库系统中存储的有关一文献 的全部信息,包括文献的地址、题录、文摘,甚至原文。 ④获取信息便利。可以通过系统迅速查找有关一检索对象的全部 资料;可以通过计算机网络进行远程检索。 ⑤获取信息及时。可以利用机械系统便于更新的特点,及时检出 最新资料。 ⑥便于检索结果的获取。主题机械检索系统的检索结果,可根据 需要加以打印、复制或套录等各种形式输出,比手工方便。 主题机检系统--构成 主题机检系统通常是由各种子系统结合而 成的多功能的一体化系统。多数包括: – 索引子系统 – 检索子系统 – 词表及各种规范文档管理子系统、 – 输入输出子系统 顺序文档和倒排文档 主文档中的文献记录的主题数据为: 登录号 标引词 001 信息检索 叙词法 调查 002 计算机检索,检索系统 叙词法 003 计算机检索,分类法,进展 004 联机检索,分类法 005 检索系统,信息检索,分类法 其对应的主题词倒排档为: 分类法 003,004,005 调查 001 计算机检索 002,003 进展 003 检索系统 002,005 联机检索 001,004 信息检索 001,005 叙词法 001,002 顺序文档和倒排文档 受控主题机检系统的功能设置 (1)主题词检索功能。通过输入主题词,输出命 中的检索对象,命中篇数,及相关信息。 (2)入口词检索功能。输入与主题词具有用代关 系的词后,按对应的主题词输出检索结果。 (3)组配检索功能。使用逻辑组配符,进行组配 检索,扩大或缩小检索范围,改进检索效果。 (4)综合查找功能*。可以与其他描述数据结合进 行综合查找。例如,北大馆联机目录的“复杂检 索”可以同时结合主题、著者、题名,进行检索 查找。 (5)浏览查找功能*。利用预先确定的标题进行浏 览查找。 受控主题机检系统的功能设置 (6)词典浏览功能。可通过显示词汇表,供检索参考。 (7)限制范围检索*。利用选择框,提供地区、时间等 限制。 (8)排序显示功能*。即根据需要对输出结果进行排列。 (9)结合联号、职号检索。一般为以论文为检索对象 的专业数据库使用。 使用职号辅助检索的系统相对较 少。 (10)输出手工检索工具。包括输出书本式主题索引或 卡片式主题目录等产品,供手工检索使用

1)计算机127 关于文献主题检索系统需改进方面 2)计算机测量控制I 3)计算机电脑 分类检索能力没有得到充分开发 )计算机石油工业[1 计算机研究 YAN JIU [I 缺乏同义控制或同义控制不充分。 6)计算机用户I 7)计算机制造设计[l ·主题标识的相关揭示有特改进,如提供词 8)计算机保密技术口l 汇浏览功能:利用参照系统提供相关词 9)计算机-操作系统I 0)计算机一产业 供与检索词字面接近的词等。 1)计算机一程序设计Il 没有进行分类主题的结合。 2)计算机-程序系统知识产权Il 3)计算机·工业企业一软件I 数据的完善提供问题。目前缺乏内容提要。 加强和完善检索结果的排列功能。 关于文本检索系统组织 关于文本检索中控制的利用 仍然采用倒排文档 文本检索系统处理对象为整个文本,而不仅仅 进行词汇控制、引入知识结构是文本检 索改进检索效果的主要形式之 ·倒排文档收入成分包括词组、词、单字,以便 可使用所有词进行检 文本检索中的控制特点是, ·为了改进检索准确性,通常记录词的位置,并 合词的位置确定相应权值 后控制; ·网络系统中还记录链接情况 ·结合词频、词位、链接,依据杈值排序: 多因素控制 在可能情况下提供同义词典,以便可以进行同 义检索 多形式控制。 关于文本检索中控制的利用 关于文本检索中控制的利用 文本检索系统常见的改进文本检索的形式 概念检素 飴合分类目录检黨。在提供检索结果的同时,提供相应分类 借助一个同义词表对输入的关键词自动添加同义词检索 目录类目,揭示分类工具的资源 自然语言语句检索 -相似检。发现一网页符合检索要求时,利用该网页词汇及 检索工具利用非用词表排除非关键词,然后把剩余的词作 链接因素,检出与该网页内容相似的网页 为关键词进行检索 合进行相关词显示,利用字面匹配的方法,根据检索提问 容错检索 通过容错词集,自动纠正提问关键词的输入错误 结合健用后控词衰,进行等级基示。供扩大或缩小检索范围 过滤检囊 允许在对检索结果动态分析的基础上提供相关词或类 通过以词汇为基础的算法,如自动删除那些包含毒品、赌 博、种族歧视、色情、暴力等内容的网页的功能。 合提供推荐簧源。( Teoma com)

9 1) 计算机 [27] 2) 计算机 测量 控制 [1] 3) 计算机 电脑 [1] 4) 计算机 石油 工业 [1] 5) 计算机 研究 YAN JIU [1] 6) 计算机 用户 [1] 7) 计算机 制造 设计 [1] 8) 计算机--保密技术 [1] 9) 计算机--操作系统 [1] 10) 计算机--产业 [2] 11) 计算机--程序设计 [3] 12) 计算机--程序系统--知识产权 [1] 13) 计算机--工业企业--软件 [1] ----------------- 关于文献主题检索系统需改进方面 • 分类检索能力没有得到充分开发。 • 缺乏同义控制 或同义控制不充分。 • 主题标识的相关揭示有待改进。如:提供词 汇浏览功能;利用参照系统提供相关词;提 供与检索词字面接近的词等。 • 没有进行分类主题的结合。 • 数据的完善提供问题。 目前缺乏内容提要。 • 加强和完善检索结果的排列功能。 关于文本检索系统组织 • 仍然采用倒排文档; • 文本检索系统处理对象为整个文本,而不仅仅 是标引词; • 倒排文档收入成分包括词组、词、单字,以便 可使用所有词进行检索; • 为了改进检索准确性,通常记录词的位置,并 结合词的位置确定相应权值; • 网络系统中还记录链接情况; • 结合词频、词位、链接,依据权值排序; • 在可能情况下提供同义词典,以便可以进行同 义检索; 关于文本检索中控制的利用 • 进行词汇控制、引入知识结构是文本检 索改进检索效果的主要形式之一。 • 文本检索中的控制特点是, – 后控制; – 多因素控制; – 多形式控制。 关于文本检索中控制的利用 • 文本检索系统常见的改进文本检索的形式 : – 概念检索 借助一个同义词表对输入的关键词自动添加同义词检索。 – 自然语言语句检索 检索工具利用非用词表排除非关键词,然后把剩余的词作 为关键词进行检索。 – 容错检索 通过容错词集,自动纠正提问关键词的输入错误。 – 过滤检索 通过以词汇为基础的算法,如自动删除那些包含毒品、赌 博、种族歧视、色情、暴力等内容的网页的功能。 关于文本检索中控制的利用 – 结合分类目录检索。在提供检索结果的同时,提供相应分类 目录类目,揭示分类工具的资源。 – 相似检索。发现一网页符合检索要求时,利用该网页词汇及 链接因素,检出与该网页内容相似的网页。 – 结合进行相关词显示。利用字面匹配的方法,根据检索提问 纪录,提供相关词,供检索扩展。(如Exite); – 结合使用后控词表,进行等级显示。供扩大或缩小检索范围。 – 允许在对检索结果动态分析的基础上提供相关词或类 (www.guidebeam.com; www.vivisimo.com) – 结合提供推荐资源。( www. Teoma.com )

利用用户检索词和后控词表提供相关帮助 动态自动分类 叫图 ∈度搜带厂在体中喜 主复机等区让 本章要求 基本标引方式及概念 基本主题类型和主题结构分析方法、有 关的引用次序 主题标引的查词规则、组配规则、多主 题标引规则、地区等的标引规则以及交 叉组配、限定组配等的概念与区分 受控主题机检系统的功能设置有哪些? 自然语言文本检索的组织特点和控制的 应用

10 利用用户检索词和后控词表提供相关帮助 动态自动分类 本章要求 • 基本标引方式及概念 • 基本主题类型和主题结构分析方法、有 关的引用次序 • 主题标引的查词规则、组配规则、多主 题标引规则、地区等的标引规则以及交 叉组配、限定组配等的概念与区分 • 受控主题机检系统的功能设置有哪些? • 自然语言文本检索的组织特点和控制的 应用

点击下载完整版文档(PDF)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
已到末页,全文结束
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有