第一节主题标引的概述 第七章主题标引 第一节主题标引的概述 1.主题标引的意义 第二节主题分析 2.主题标引方式 第三节主题标引规则 第四节主题检索工具 1.主题标引的意义 2.标引方式 主题标引—一是依据一定的主题词表或主题标 标引方式是根据文献特点和使用需 规则,赋予文献语词标识的过程。分为受控标 要确定的标引和揭示文献主题的形式 引和自由标引两种 受控标引—依据词表为工具,使用经过控制的 整体标引 语词标识进行标引,目前国内主要使用叙词法。 全面标引 对口标引 自由标引不依据词表,由标引人员根据文献 综合标引 内容,直接用自然语言中的语词进行标引。 分析标引 2标引方式—体标引 2标引方式—全面标引 亦称浅标引,是一种概括揭示文献基 本主题内容的标引 全国标引亦称深标引是种充分揭示文就论及的所 有有检价值的主题念的标引。 例:《信息管理板论》标引为:信息管理 《我国能派结构和大气环境污染 《汽车与拖拉机液压传动系统》 能源、消贵结构、烟污染、空气污 标引为:汽车—液压传动系统 技术、煤、环保护中国、环策 适用于手检系统。一般予1一2个分类号,2 8个标引词 用结合机检系统处理论文、技术报告等:主题词的标引 数量常在5—20个主右
1 第七章 主题标引 第一节 主题标引的概述 第二节 主题分析 第三节 主题标引规则 第四节 主题检索工具 第一节 主题标引的概述 1. 主题标引的意义 2. 主题标引方式 1. 主题标引的意义 主题标引——是依据一定的主题词表或主题标引 规则,赋予文献语词标识的过程。分为受控标 引和自由标引两种。 受控标引——依据词表为工具,使用经过控制的 语词标识进行标引,目前国内主要使用叙词法。 自由标引——不依据词表,由标引人员根据文献 内容,直接用自然语言中的语词进行标引。 2. 标引方式 标引方式——是根据文献特点和使用需 要确定的标引和揭示文献主题的形式。 包括: – 整体标引 – 全面标引 – 对口标引 – 综合标引 – 分析标引 2.标引方式——整体标引 整体标引——亦称浅标引,是一种概括揭示文献基 本主题内容的标引。 例:《信息管理概论》 标引为:信息管理 《汽车与拖拉机液压传动系统》 标引为:汽车——液压传动系统 拖拉机——液压传动系统 适用于手检系统。一般赋予1—2个分类号,2— 8个标引词。 2.标引方式——全面标引 全面标引——亦称深标引,是一种充分揭示文献论及的所 有有检索价值的主题概念的标引。 例:《我国能源结构和大气环境污染》 全面标引为:能源、消费结构、煤烟污染、空气污 染、无污染技术、煤、环境保护、中国、环境政策、 能源构成、污染防止等 适用结合机检系统处理论文、技术报告等;主题词的标引 数量通常在5—20个左右
2标引方式—对口标引 2标引方式—综合标引 对口标引亦称重点标引,是一种只揭示 综合标引—是一种以集合型信息资源的整 文献中适合本专业需要的主题内容的标引 体为单位进行的橛括性标引。 例如:《汽车与拖拉机液压传动系统》汽车 制造文献部门可只标引 般应根据情况对文献类型进行必要的揭示。 汽车—液压传动系统 例如:《机械设计丛书》 适用专业文献单位 标引为:机械设计一丛书 2标引方式——分析标引 第二节主题分析 分析标引是一种根据信息资源中部分 主题分析—指根据文献标引和检索的需要, 片段或集合型信息资源的构成单元进行 对文献主题内容进行分析,提炼主题概 念的过程。 通常要求掌握对文献主题类型、主题结构 例如:对《西行漫记》一书中毛泽东 的基本分析方法,在充分把握文献主题 生平的内容加以揭示。 对象及其构成因素的基础上,对主题概 念进行提炼和取舍,确定待标概念。 1.文献主题类型分析 1.文献主题类型分析 按主题数量 常见联结主题类型 单主题。如,汽车、汽车发动机、网络安 全检测 应用关系:计算机在图书馆的应用 多主题。 比较关系:分类法与主题法的比较 并列关系主题,如,汽车和拖拉机的维修 影响关系:气候对农业生产的影响等 从属关系主题,如,物理学和固体物理学 因果关系。经济改革对人们价值观的冲击 联结主题。指两或多个主题对象之间根据 倾向关系。供社会科学研究使用的数学方 定的联系所形成的一种主题类型。常见的有 应用关系、比较关系、影响关系等
2 2.标引方式——对口标引 对口标引——亦称重点标引,是一种只揭示 文献中适合本专业需要的主题内容的标引。 例如:《汽车与拖拉机液压传动系统》 汽车 制造 文献部门可只标引: 汽车——液压传动系统 适用专业文献单位 。 2.标引方式——综合标引 综合标引——是一种以集合型信息资源的整 体为单位进行的概括性标引。 一般应根据情况对文献类型进行必要的揭示。 例如:《机械设计丛书》 标引为:机械设计 —丛书 2.标引方式——分析标引 分析标引——是一种根据信息资源中部分 片段或集合型信息资源的构成单元进行 的标引。 例如:对《西行漫记》一书中毛泽东 生平的内容加以揭示。 第二节 主题分析 主题分析——指根据文献标引和检索的需要, 对文献主题内容进行分析,提炼主题概 念的过程。 通常要求掌握对文献主题类型、主题结构 的基本分析方法,在充分把握文献主题 对象及其构成因素的基础上,对主题概 念进行提炼和取舍,确定待标概念。 1. 文献主题类型分析 按主题数量 • 单主题。如,汽车、汽车发动机、网络安 全检测 ; • 多主题。 – 并列关系主题,如,汽车和拖拉机的维修; – 从属关系主题,如,物理学和固体物理学; – 联结主题。指两或多个主题对象之间根据一 定的联系所形成的一种主题类型。常见的有 应用关系、比较关系、影响关系等。 1. 文献主题类型分析 常见联结主题类型: 应用关系:计算机在图书馆的应用 比较关系:分类法与主题法的比较 影响关系:气候对农业生产的影响等 因果关系。经济改革对人们价值观的冲击 倾向关系。供社会科学研究使用的数学方 法
1文献主题类型分析 1.文献主题类型分析 按照论述的重要程度 ·按主题成分 主要主题 单元主题。图书馆学;美术馆 次要主题 复合主题。图书馆藏书管理 按照与检索系统的相关程度, 专业主题 中小学教学方法研究 非专业主题 按照文献论述的直接 显性主题 隐性主题等 2.分析主题结构 主题分面公式 主题结构—指文献主题的基本主题因 科茨提出的显著性引用次序:事物一部件 素以及它们之间的关系。 材料一活动一施动者 分析目的,为了在查明主题构成因素 及其相互关系的基础上,对主题概 我国国家标准中提出的主题分面公式 念进行提炼。 A主体因素 A2材料、A3 分析方法:模式化分析。一般利用各 方法、A4过程、A5条件等) 国学者提出的各种主题关系的结构 B通用因素 模式,作为主题分析和确定先组式 C空间因素 主题标题的依搪 D时间因素 E文献类型因素 主题结构分析举例 3.常见主题分析误差 例一:“中国八十年代农田水利规程手册 农田水利规程中国八十年代手册 主体因素通用因素位置因素时间因素文献类型因素 主题概念提炼不足。 例二:“九十年代法国航空发动机设计” 航空发动机设计 主题概念提炼过度 法国九十年代 (主体因素)(通用因素)(位置因素)(时间因素) 提炼错误 例三:“高原桥梁混凝土施工 桥梁混凝土施工高原 Al对象A2材料A3方法位置因素
3 1.文献主题类型分析 • 按主题成分 – 单元主题。图书馆学;美术馆; – 复合主题。图书馆藏书管理、 中小学教学方法研究; 1. 文献主题类型分析 • 按照论述的重要程度, – 主要主题 – 次要主题; • 按照与检索系统的相关程度, – 专业主题 – 非专业主题; • 按照文献论述的直接 – 显性主题 – 隐性主题等。 2. 分析主题结构 主题结构——指文献主题的基本主题因 素以及它们之间的关系。 分析目的,为了在查明主题构成因素 及其相互关系的基础上,对主题概 念进行提炼。 分析方法:模式化分析。 一般利用各 国学者提出的各种主题关系的结构 模式,作为主题分析和确定先组式 主题标题的依据。 主题分面公式 • 科茨提出的显著性引用次序:事物-部件 -材料-活动-施动者。 • 我国国家标准中提出的主题分面公式: A 主体因素(A1研究对象、A2材料、A3 方法、A4过程、A5条件等) B通用因素 C空间因素 D时间因素 E文献类型因素 主题结构分析举例 例一:“中国八十年代农田水利规程手册” 农田水利 规程 中国 八十年代 手册 主体因素 通用因素 位置因素 时间因素 文献类型因素 例二: “九十年代法国航空发动机设计” 航空发动机 设计 法国 九十年代 (主体因素)(通用因素)(位置因素)(时间因素) 例三:“高原桥梁混凝土施工” 桥梁 混凝土 施工 高原 A1对象 A2 材料 A3 方法 位置因素 3. 常见主题分析误差 • 主题概念提炼不足。 • 主题概念提炼过度。 • 提炼错误
第三节主题标引规则 1.查词规则 ②选取最专指的叙词标引 主题标引的基本规则 (3)组配标引 (4)上位叙词标引 1.主题标引的查词规则 (⑤词标引。 2.主题标引的组配规则 (6)增词标引。 二.各种主题、信息资源类型标引规 自由词标引 标引数量:一般每种图书的标引词 则 数量保持在1—8个之间,机检 系统主题词数量可适当增加 2.组配标引规则 2.组配标引规则 将两个或两个以上叙词按照一定的逻辑关系结合 在一起,表达文献主题,称为组配标引。包括 限定组配是以表示事物的叙词和表示事物 特称、属性、方面的叙词进行组配,表 交叉组配和限定组配 个新的专指概念,通常以符号“”或 交叉组配是指选用若干个具有交叉关系的叙词进 为组配标识 行组配,表达一个复合的子概念,通常以符号 “:”为组配标识。例: 限定组配类型包括 “动物遗传学”标引为:动物学:遗传学。 ①特称限定组配 因际铁路联运”标引为:铁路运输:国际运输: ②方面限定组配 联合运输。 ③说明语限定组配 ④联结组配 2.组配标引规则 2.组配标引规则 ①带称限定组,表示一物与它的部分概念之间的组陀 为:机车发电机; (1)叙词的组配必须是概念组配,而不是字面组配 组配。表示物与其方面念之间 (2)叙词的组配应优先采用交叉组配。例 植物生态学标引为:植物学:生态学 不标引为:植物一生态学 以是叙词政自然语言。例如 天然气燃料的汽车标为:汽车,用天然气燃料的 柴油机维修标引为:柴油机一维修 ④联結组配。衰示事物与其具有联皓关系的事物关系的组配 (3)叙词的组配不能越级。可以用相应专指叙词组 例如:气候对农业的影响标弓 时,不得使用该词的上位词或下位词进行组
4 第三节 主题标引规则 一. 主题标引的基本规则 1. 主题标引的查词规则 2. 主题标引的组配规则 二. 各种主题、信息资源类型标引规 则 1. 查词规则 ⑴用正式叙词标引。 ⑵选取最专指的叙词标引。 ⑶组配标引。 ⑷上位叙词标引 。 ⑸靠词标引。 ⑹增词标引。 ⑺自由词标引。 标引数量:一般每种图书的标引词 数量保持在1—8个之间,机检 系统主题词数量可适当增加。 2. 组配标引规则 将两个或两个以上叙词按照一定的逻辑关系结合 在一起,表达文献主题,称为组配标引。包括: 交叉组配和限定组配。 交叉组配是指选用若干个具有交叉关系的叙词进 行组配,表达一个复合的子概念,通常以符号 “:”为组配标识。例: “动物遗传学” 标引为:动物学:遗传学。 “国际铁路联运”标引为:铁路运输:国际运输: 联合运输。 2. 组配标引规则 限定组配是以表示事物的叙词和表示事物 特称、属性、方面的叙词进行组配,表示 一个新的专指概念,通常以符号“—”或 “,”为组配标识。 限定组配类型包括: ①特称限定组配。 ②方面限定组配。 ③说明语限定组配。 ④联结组配。 2. 组配标引规则 ①特称限定组配。表示一事物与它的部分概念之间的组配。 例如: 机车发电机 标为:机车—发电机; ②方面限定组配。表示一事物与其方面概念之间的组配。包 括:材料、性质、现象状态、工艺、理论、地区、时代文 献类型等。例如:铝金属板 标为:铝—金属板 ③说明语限定组配。用于对事物作补充说明,表示事物的性 质、特征等,说明语可以是叙词或自然语言。例如: 天然气燃料的汽车 标为:汽车,用天然气燃料的 ④联结组配。表示事物与其具有联结关系的事物关系的组配。 例如:气候对农业的影响 标引为:气候—影响—农业 2. 组配标引规则 ⑴叙词的组配必须是概念组配,而不是字面组配。 ⑵叙词的组配应优先采用交叉组配。例: 植物生态学 标引为: 植物学:生态学 不标引为:植物—生态学 柴油机维修 标引为:柴油机—维修 ⑶叙词的组配不能越级。可以用相应专指叙词组配 时,不得使用该词的上位词或下位词进行组配
2.组配标引规则 2.组配标引规则 (4)必须选用与文就主题关系最密切的叙词进行組配 5叙词组配的结果必须明确,具有单义性,一义 例,主题“飞机结构设计”的相关叙词组配形 飞机一结构一设计 法加以处理。如,“工业一橡胶”直接用“工业橡 飞机结构一设计 6)并列多主题文就 飞机一结构设计 用分组组配 飞机结构结构设计 例,主题“海底采煤机被”的相关叙词组配形式 洪水一长江流域 海底采煤采煤机械 干早一华北平原 果煤机械:海底采矿设备 在机检系统中,则可使用联号,标引为 采煤机械:水采机械 长江流域 海底采煤一水采机械 2.组配标引规则 2.组配标引规则 7)一标题中的叙 可按主体因素、通用 因素、空间因素、时间因素、文献类型因素 题中多个主体因素的叙词,可按对象、 的次序排列 材料、操作、工具的次序序列 例,主题“计算机系统对高层建筑控制”, 如“中国80年代汽车工业规划研究文集”的标引 可标引为: 次序为 高层建筑一计算机控制一计算机系统 汽车工业一规划一中国1980-1989—文 如何使用示波器检测收音机”的标引次 收音机检测示波器 轮排模式 2.组配标引规则 (8)关于式。国内采用轮替法轮排: (9)标引的级别通常保持在三级以下 DABC 般不超过五级。 例:电子计算机硬盘生产工艺 碳微盘一电子计算机生产工艺 每种文献的标题数量一般应保持在四个以 使用“:”、“,”连接的主题词,轮排中随原连接的词移动 下 例:小说语言学:学 些进行深度标引的系统可提供适当供后 语言学:美学一小 组检索的词。 联结主题的轮排,必要时对连接词应作适当调整。(见教材 269页)
5 2. 组配标引规则 ⑷必须选用与文献主题关系最密切的叙词进行组配。 例,主题“飞机结构设计” 的相关叙词组配形式: 飞机—结构—设计 飞机结构—设计 飞机—结构设计 飞机结构—结构设计 例,主题“海底采煤机械”的相关叙词组配形式: 海底采煤—采煤机械 采煤机械:海底采矿设备 采煤机械:水采机械 海底采煤—水采机械 2. 组配标引规则 ⑸叙词组配的结果必须明确,具有单义性。二义 性组配,应通过明确词序或采用增词标引的方 法加以处理。如,“工业-橡胶”直接用“工业橡 胶”。 ⑹并列多主题文献,可采用分组组配,以联系符 号揭示联系。如:“长江流域洪水和华北平原干 旱” 可标引为: 洪水─长江流域 干旱-华北平原 在机检系统中,则可使用联号,标引为: 洪水 1 长江流域 1 干旱 2 华北平原 2 2. 组配标引规则 (7)一标题中的叙词,可按主体因素、通用 因素、空间因素、时间因素、文献类型因素 的次序排列。 如“中国80年代汽车工业规划研究文集”的标引 次序为: 汽车工业—规划—中国—1980-1989—文 集 2. 组配标引规则 一标题中多个主体因素的叙词,可按对象、 材料、操作、工具的次序序列。 例,主题“计算机系统对高层建筑控制”, 可标引为: 高层建筑-计算机控制-计算机系统 “如何使用示波器检测收音机”的标引次 序为: 收音机—检测—示波器 轮排模式 (8)关于轮排模式。国内采用轮替法轮排 : A B C D B A C D C A B D D A B C 例:电子计算机—硬磁盘—生产工艺 硬磁盘—电子计算机—生产工艺 使用“:”、“,”连接的主题词,轮排中随原连接的词移动。 例: 小说—语言学:美学 语言学:美学—小说 美学:语言学—小说 联结主题的轮排,必要时对连接词应作适当调整。 (见教材 269页) 2. 组配标引规则 (9)标引的级别通常保持在三级以下,一 般不超过五级。 每种文献的标题数量一般应保持在四个以 下。 一些进行深度标引的系统可提供适当供后 组检索的词
二.各种主题、文献类型的标引 2多主题文献的标引 1单主题文就的标引 2多主题文献的标引包括联结主题标引 并列主文献应根据论述的主题对象分组标引,并 列主题的数量超过四个时,使用上位叙词标引 3论及地区、时代文献的标引 4传记文就的标引 《几童疾病与保健》标引为:婴幼儿一保健 5文艺文献的主题标引 小儿疾病一常见病治疗 6丛书、多卷书、论文集的主题标引 7.百科全书、年鳖、手册、诃典的主题标引 《粮食作物虫謇防止》(玉米、大豆、小麦、谷子 8目录、素引的主题标引 标引为:禾谷类作物一病虫害防止方 9特种文就和非书资料的主题标引 2多主题文献的标引 2.多主题文献的标引 从属关系主题的文献,凡同时论述大主题和 (3)联结主题,按主题关系类型进行主题标引,并轮 小主题时,应分别对论述主题分组标引。例 关系主题的文献,一般以应用到的主题作主标题 《网络安全与黑客》 《运筹学在钫织工业中的应用】 标引为:计算机网络一安 标引为:运学一应用一鲂织T业 幼织工业一应用一运筹学 《激光在医学和生物学中的应用》 《分子生物学与基因工程》 标引为:医学一激光应用 标引为:分子生物学 生物学一激光应用 激光应用一医学 基因工程 2.多主题文献的标引 2多主题文献的标引 比较关系主题的文献,一般应以文献论述重点为主标 表示主题之间相互关系的联主题,均以其点论述 题,并加以轮排。例如 的一方作主标厦,以另方作副标,并进行轮排 《普通话与方言 标引为:普還话一比较汉语方言 《学与少民族思想文化》 汉语方言一比较普還话 标引为:儒家一关系一少激民族民族文化 少民族民族文化关系一儒家 影响取因果关系主题的文献,一般应以被影响或表示 结果的主题作主标题,并加以轮排。例如 《归纳逻舞与人工智能 《气候变迁对我国农业影响的研究》 标引为:归纳是舞关系一人工智能 标引为:农业一中国影响因素气候变化 人工智能关系一归纳一逻辑 气候变化影响农业中国
6 二. 各种主题、文献类型的标引 1.单主题文献的标引 2.多主题文献的标引(包括联结主题标引) 3.论及地区、时代文献的标引 4.传记文献的标引 5.文艺文献的主题标引 6.丛书、多卷书、论文集的主题标引 7.百科全书、年鉴、手册、词典的主题标引 8.目录、索引的主题标引 9.特种文献和非书资料的主题标引 2.多主题文献的标引 并列主题文献应根据论述的主题对象分组标引,并 列主题的数量超过四个时,使用上位叙词标引。 例: 《儿童疾病与保健》标引为:婴幼儿—保健 小儿疾病—常见病治疗 《粮食作物虫害防止》(玉米、大豆、小麦、谷子、 水稻等) 标引为:禾谷类作物—病虫害防止方 法 2.多主题文献的标引 • 从属关系主题的文献 ,凡同时论述大主题和 小主题时,应分别对论述主题分组标引。 例 如: 《网络安全与黑客》 标引为:计算机网络-安全 黑客 《分子生物学与基因工程》 标引为:分子生物学 基因工程 2. 多主题文献的标引 (3)联结主题 ,按主题关系类型进行主题标引,并轮排。 具体如: • 应用关系主题的文献,一般以应用到的主题作主标题, 并轮排。例: 《运筹学在纺织工业中的应用》 标引为:运筹学-应用-纺织工业 纺织工业-应用-运筹学 《激光在医学和生物学中的应用》 标引为:医学-激光应用 生物学-激光应用 激光应用-医学 激光应用-生物学 ⒉ 多主题文献的标引 • 比较关系主题的文献,一般应以文献论述重点为主标 题,并加以轮排。例如: 《普通话与方言》 标引为:普通话—比较—汉语方言 汉语方言—比较—普通话 • 影响或因果关系主题的文献,一般应以被影响或表示 结果的主题作主标题,并加以轮排。例如: 《气候变迁对我国农业影响的研究》 标引为:农业—中国—影响因素—气候变化 气候变化—影响—农业—中国 ⒉多主题文献的标引 • 表示主题之间相互关系的联结主题,均以其重点论述 的一方作主标题,以另一方作副标题,并进行轮排。 例如: 《儒学与少数民族思想文化》 标引为:儒家—关系—少数民族—民族文化 少数民族—民族文化—关系—儒家 《归纳逻辑与人工智能》 标引为:归纳—逻辑—关系—人工智能 人工智能—关系—归纳-逻辑
2多主题文献的标引 3关于涉及地区对象文献的标引 向关系主文就指根捐一定读者需罢角度论述 以论述对象为主标题,以读着成论述 (1)论述一地区全面情况的文献,以地区主题词 角度为副标晨进行组配标引。例如 作主标题标引,必要时进行轮排。例如: 标引为:英语,旅游用 个复杂主题文就,按限主题类型和涉及的各个主题 巴勒斯坦一地理 象,分别进行组配标引。例如 地理一巴勒斯坦 制论、信息论、系统科学与哲学》 (2)论述一地区专业领域内容的文献,以主题内 标引为:控制论关系哲学 容作主标题,以地区主题词作副标题。例如: 信息论关系一学 系统科学关系哲学 农业一英国一现代 3关于涉及地区对象文献的标引 第四节主题检索工具 按照采用的设备条件,分为: (3)确定直接标引和间接标引 手检主题工具:包括主题目录和主题索引 城市地理一广州 主题机检系统,可以是不同对象的数据库 按照组配先后,分为: 地方志一浙江一桐乡 先组式检索系统,通常需要建立标题 雕塑一罗马 后组式检索系统,通常根据检索软件的要求,按 定的机读编目格式输入,供机械检索使用 旅游指南一德国一科隆 按照是否控制,分为: 控制系统 自然语言系统 手工主题目录一以文献为中心的系统 书本式主题索引一以标识为中心的系统 信息系统一信息交换247047 城市道路 业一气候一世界 作物一气候一世界 道路网一设计301001 世界农业气候与作物气候世界农业气候与作物气候 立体交叉一标准化141007 立体交叉一结构设计141011 一工程地质图一地图制图学161020,161024 城市污水 一活性污泥处理025005 一排水一城市规划025007,025010 水处理一化学净化025003
7 ⒉多主题文献的标引 • 倾向关系主题文献,指根据一定读者需要角度论述特 定的文献,一般以论述对象为主标题,以读者或论述 角度为副标题进行组配标引。例如: 《旅游英语》 标引为:英语,旅游用 • 多个复杂主题文献,按照主题类型和涉及的各个主题 对象,分别进行组配标引。例如: 《控制论、信息论、系统科学与哲学》 标引为:控制论—关系—哲学 信息论—关系—哲学 系统科学—关系—哲学 3.关于涉及地区对象文献的标引 (1)论述一地区全面情况的文献,以地区主题词 作主标题标引,必要时进行轮排。例如: 荷兰—概况 巴勒斯坦-地理 地理-巴勒斯坦 (2)论述一地区专业领域内容的文献,以主题内 容作主标题,以地区主题词作副标题。例如: 农业—英国—现代 3.关于涉及地区对象文献的标引 (3)确定直接标引和间接标引 城市地理—广州 地方志—浙江—桐乡 雕塑—罗马 旅游指南-德国-科隆 第四节 主题检索工具 按照采用的设备条件,分为: • 手检主题工具:包括主题目录和主题索引; • 主题机检系统,可以是不同对象的数据库。 按照组配先后,分为: • 先组式检索系统,通常需要建立标题; • 后组式检索系统,通常根据检索软件的要求,按 一定的机读编目格式输入,供机械检索使用。 按照是否控制,分为: • 控制系统; • 自然语言系统, 手工主题目录—以文献为中心的系统 农业-气候-世界 世界农业气候与作物气候/ 作物-气候-世界 世界农业气候与作物气候/ 书本式主题索引—以标识为中心的系统 城市 —信息系统—信息交换 247047 城市道路 —道路网—设计 301001 —立体交叉—标准化 141007 —立体交叉—结构设计 141011 城市图 —工程地质图—地图制图学 161020,161024 城市污水 —泵站—结构设计 025004 —活性污泥处理 025005 —排水—城市规划 025007,025010 —污水处理—化学净化 025003
主题机检系统一优点 主题机检系统一一构成 ①检紫灵活。可以后组方式,通过主题词的组配,自由扩大或缩 主题机检系统通常是由各种子系统结合而 检索范围,满足各种检索需要 成的多功能的一体化系统。多数包括 ②检素方式多样.可设置多种检索方式,如布尔逻辑检索、截词 索、利用机读词表检索、采用加权等多种检索手段 索引子系统 ③获取情息亮分。可以迅速获取数据库系统中存储的有关一文献 检索子系统 息,包括文献的地址、题录、文摘,甚至原义 ④获取信息便利,可以通过系统迅速查找有关一检索对象的全部 表及各种规范文档管理子系统 通过计算机网络进行远程检索 输入输出子系统 ⑤获取信息及时。可以利用机械系统便于更新的特点,及时检出 ⑥便于检囊结果的获取。主题机械检索系统的检索结果,可根据 需要加以打印、复制或套录等各种形式输出,比手工方使 顺序文档和倒排文档 顺序文档和倒排文档 其对应的主题词倒排档为: 主文档中的文献记录的主题数据为 分类法 003,004,005 登录号标引词 调查 001信息检索叙词法调查 计算机检索002,003 002计算机检索,检索系统叙词法 进展 计算机检索,分类法,进展 检索系统002,005 联机检索,分类法 联机检索001,004 检索系统,信息检索,分类法 信息检索001,005 叙词法 受控主题机检系统的功能设置 受控主题机检系统的功能设置 (1)主题词检功能。通过输入主题词,输出命 的检索对象,命中篇数,及相关信息 (6)词典浏览功能。可通过显示词汇表,供检索参考 (2)入口词检索功能。输入与主题词具有用代关 (7)限制范國检業*。利用选择框,提供地区、时间等 系的词后,按对应的主题词输出检索结果。 (3)組配检功能。使用逻辑组配符,进行组配 (8)排序显示功能*。即根据需要对输出结果进行排列 检索,扩大或缩小检索范围,改进检索效果 (9)结合联号、职号检索。一般为以论文为检索对象 (4)综合查找功能*。可以与其他描述数据结合进 的专业数据库使用。使用职号辅助检索的系统相对较 行综合查找。例如,北大馆联机目录的“复杂检 索”可以同时结合主题、著者、题名,进行检索 (10)输出手工检素工具。包括输出书本式主题索引或 卡片式主题目录等产品,供手工检索使用 (5)浏览查找功能*。利用预先确定的标题进行浏 览查找
8 主题机检系统-优点 ①检索灵活。可以后组方式,通过主题词的组配,自由扩大或缩 小检索范围,满足各种检索需要。 ②检索方式多样。可设置多种检索方式,如布尔逻辑检索、截词 检索、利用机读词表检索、采用加权等多种检索手段。 ③获取信息充分。可以迅速获取数据库系统中存储的有关一文献 的全部信息,包括文献的地址、题录、文摘,甚至原文。 ④获取信息便利。可以通过系统迅速查找有关一检索对象的全部 资料;可以通过计算机网络进行远程检索。 ⑤获取信息及时。可以利用机械系统便于更新的特点,及时检出 最新资料。 ⑥便于检索结果的获取。主题机械检索系统的检索结果,可根据 需要加以打印、复制或套录等各种形式输出,比手工方便。 主题机检系统--构成 主题机检系统通常是由各种子系统结合而 成的多功能的一体化系统。多数包括: – 索引子系统 – 检索子系统 – 词表及各种规范文档管理子系统、 – 输入输出子系统 顺序文档和倒排文档 主文档中的文献记录的主题数据为: 登录号 标引词 001 信息检索 叙词法 调查 002 计算机检索,检索系统 叙词法 003 计算机检索,分类法,进展 004 联机检索,分类法 005 检索系统,信息检索,分类法 其对应的主题词倒排档为: 分类法 003,004,005 调查 001 计算机检索 002,003 进展 003 检索系统 002,005 联机检索 001,004 信息检索 001,005 叙词法 001,002 顺序文档和倒排文档 受控主题机检系统的功能设置 (1)主题词检索功能。通过输入主题词,输出命 中的检索对象,命中篇数,及相关信息。 (2)入口词检索功能。输入与主题词具有用代关 系的词后,按对应的主题词输出检索结果。 (3)组配检索功能。使用逻辑组配符,进行组配 检索,扩大或缩小检索范围,改进检索效果。 (4)综合查找功能*。可以与其他描述数据结合进 行综合查找。例如,北大馆联机目录的“复杂检 索”可以同时结合主题、著者、题名,进行检索 查找。 (5)浏览查找功能*。利用预先确定的标题进行浏 览查找。 受控主题机检系统的功能设置 (6)词典浏览功能。可通过显示词汇表,供检索参考。 (7)限制范围检索*。利用选择框,提供地区、时间等 限制。 (8)排序显示功能*。即根据需要对输出结果进行排列。 (9)结合联号、职号检索。一般为以论文为检索对象 的专业数据库使用。 使用职号辅助检索的系统相对较 少。 (10)输出手工检索工具。包括输出书本式主题索引或 卡片式主题目录等产品,供手工检索使用
1)计算机127 关于文献主题检索系统需改进方面 2)计算机测量控制I 3)计算机电脑 分类检索能力没有得到充分开发 )计算机石油工业[1 计算机研究 YAN JIU [I 缺乏同义控制或同义控制不充分。 6)计算机用户I 7)计算机制造设计[l ·主题标识的相关揭示有特改进,如提供词 8)计算机保密技术口l 汇浏览功能:利用参照系统提供相关词 9)计算机-操作系统I 0)计算机一产业 供与检索词字面接近的词等。 1)计算机一程序设计Il 没有进行分类主题的结合。 2)计算机-程序系统知识产权Il 3)计算机·工业企业一软件I 数据的完善提供问题。目前缺乏内容提要。 加强和完善检索结果的排列功能。 关于文本检索系统组织 关于文本检索中控制的利用 仍然采用倒排文档 文本检索系统处理对象为整个文本,而不仅仅 进行词汇控制、引入知识结构是文本检 索改进检索效果的主要形式之 ·倒排文档收入成分包括词组、词、单字,以便 可使用所有词进行检 文本检索中的控制特点是, ·为了改进检索准确性,通常记录词的位置,并 合词的位置确定相应权值 后控制; ·网络系统中还记录链接情况 ·结合词频、词位、链接,依据杈值排序: 多因素控制 在可能情况下提供同义词典,以便可以进行同 义检索 多形式控制。 关于文本检索中控制的利用 关于文本检索中控制的利用 文本检索系统常见的改进文本检索的形式 概念检素 飴合分类目录检黨。在提供检索结果的同时,提供相应分类 借助一个同义词表对输入的关键词自动添加同义词检索 目录类目,揭示分类工具的资源 自然语言语句检索 -相似检。发现一网页符合检索要求时,利用该网页词汇及 检索工具利用非用词表排除非关键词,然后把剩余的词作 链接因素,检出与该网页内容相似的网页 为关键词进行检索 合进行相关词显示,利用字面匹配的方法,根据检索提问 容错检索 通过容错词集,自动纠正提问关键词的输入错误 结合健用后控词衰,进行等级基示。供扩大或缩小检索范围 过滤检囊 允许在对检索结果动态分析的基础上提供相关词或类 通过以词汇为基础的算法,如自动删除那些包含毒品、赌 博、种族歧视、色情、暴力等内容的网页的功能。 合提供推荐簧源。( Teoma com)
9 1) 计算机 [27] 2) 计算机 测量 控制 [1] 3) 计算机 电脑 [1] 4) 计算机 石油 工业 [1] 5) 计算机 研究 YAN JIU [1] 6) 计算机 用户 [1] 7) 计算机 制造 设计 [1] 8) 计算机--保密技术 [1] 9) 计算机--操作系统 [1] 10) 计算机--产业 [2] 11) 计算机--程序设计 [3] 12) 计算机--程序系统--知识产权 [1] 13) 计算机--工业企业--软件 [1] ----------------- 关于文献主题检索系统需改进方面 • 分类检索能力没有得到充分开发。 • 缺乏同义控制 或同义控制不充分。 • 主题标识的相关揭示有待改进。如:提供词 汇浏览功能;利用参照系统提供相关词;提 供与检索词字面接近的词等。 • 没有进行分类主题的结合。 • 数据的完善提供问题。 目前缺乏内容提要。 • 加强和完善检索结果的排列功能。 关于文本检索系统组织 • 仍然采用倒排文档; • 文本检索系统处理对象为整个文本,而不仅仅 是标引词; • 倒排文档收入成分包括词组、词、单字,以便 可使用所有词进行检索; • 为了改进检索准确性,通常记录词的位置,并 结合词的位置确定相应权值; • 网络系统中还记录链接情况; • 结合词频、词位、链接,依据权值排序; • 在可能情况下提供同义词典,以便可以进行同 义检索; 关于文本检索中控制的利用 • 进行词汇控制、引入知识结构是文本检 索改进检索效果的主要形式之一。 • 文本检索中的控制特点是, – 后控制; – 多因素控制; – 多形式控制。 关于文本检索中控制的利用 • 文本检索系统常见的改进文本检索的形式 : – 概念检索 借助一个同义词表对输入的关键词自动添加同义词检索。 – 自然语言语句检索 检索工具利用非用词表排除非关键词,然后把剩余的词作 为关键词进行检索。 – 容错检索 通过容错词集,自动纠正提问关键词的输入错误。 – 过滤检索 通过以词汇为基础的算法,如自动删除那些包含毒品、赌 博、种族歧视、色情、暴力等内容的网页的功能。 关于文本检索中控制的利用 – 结合分类目录检索。在提供检索结果的同时,提供相应分类 目录类目,揭示分类工具的资源。 – 相似检索。发现一网页符合检索要求时,利用该网页词汇及 链接因素,检出与该网页内容相似的网页。 – 结合进行相关词显示。利用字面匹配的方法,根据检索提问 纪录,提供相关词,供检索扩展。(如Exite); – 结合使用后控词表,进行等级显示。供扩大或缩小检索范围。 – 允许在对检索结果动态分析的基础上提供相关词或类 (www.guidebeam.com; www.vivisimo.com) – 结合提供推荐资源。( www. Teoma.com )
利用用户检索词和后控词表提供相关帮助 动态自动分类 叫图 ∈度搜带厂在体中喜 主复机等区让 本章要求 基本标引方式及概念 基本主题类型和主题结构分析方法、有 关的引用次序 主题标引的查词规则、组配规则、多主 题标引规则、地区等的标引规则以及交 叉组配、限定组配等的概念与区分 受控主题机检系统的功能设置有哪些? 自然语言文本检索的组织特点和控制的 应用
10 利用用户检索词和后控词表提供相关帮助 动态自动分类 本章要求 • 基本标引方式及概念 • 基本主题类型和主题结构分析方法、有 关的引用次序 • 主题标引的查词规则、组配规则、多主 题标引规则、地区等的标引规则以及交 叉组配、限定组配等的概念与区分 • 受控主题机检系统的功能设置有哪些? • 自然语言文本检索的组织特点和控制的 应用