第八章主题法 第一节主题法概述 主题法一直接以表达文献主题的语词作检索标识以字 第一节主题法概述 顺为主要检索途径的标引和检索文献的方法 第二节叙词表的结构 主题法特征 第三节叙词法的词汇控制 直接以语词为检素标识。例:“茶的焙制”,分类标 识为:TS272.41主题标识为:“茶叶加工” 第四节叙词表的编制与维护 以字顺为主要检宗途径。汉语一拼音或笔划笔顺。 以主题为中心集中图书资料 通过参照系统等揭示主题之间关系 主题法的类型 1标题法 按照选词方式 ·标题法—一种以标题词作为主题标识 以词表预先确定的组配方式标引和检索 叙词法 的主题法 ·标题词一亦称标题,指经过规范化处理 的,用来标引文献的词或词组,通常为 比较定型的事物名称 美国国会标题表基本标题类型 (Lbrary of Congress Sbject Heading) 副标题、复分标题 Library(图书馆一单词标题) 自由浮动通用复分表(Fre English literature(英语文学一形容词词组标题) Floating Subdivisions ): Children in motion pictures(电影中的儿童一介词词组标题 种族、团体、 Literature and science(文学与科学一连词词组标题 人名、地名 Chemistry, Organic(有机化学一倒量标题) 示范标题: Cookery( Frozen food)(冷冻食品的烹调一带限定调的标题) Personal name]in Reference books-Bibliography(参考书一书目一复分标题) poetry, etc [Topic or place] in literatu [Topic or place] in art
1 第八章 主题法 第一节 主题法概述 第二节 叙词表的结构 第三节 叙词法的词汇控制 第四节 叙词表的编制与维护 第一节 主题法概述 主题法—直接以表达文献主题的语词作检索标识,以字 顺为主要检索途径的标引和检索文献的方法。 主题法特征 • 直接以语词为检索标识。例:“茶的焙制”,分类标 识为:TS272.4;主题标识为:“茶叶加工” ; • 以字顺为主要检索途径。汉语-拼音或笔划笔顺。 • 以主题为中心集中图书资料。 • 通过参照系统等揭示主题之间关系。 主题法的类型 • 按照选词方式, – 标题法 – 元词法 – 叙词法 – 关键词法 • 按照组配的先后 – 为先组式主题法 – 后组式主题法 • 按照是否控制 – 自然语言主题法 – 受控主题法 1.标题法 • 标题法 —一种以标题词作为主题标识, 以词表预先确定的组配方式标引和检索 的主题法。 • 标题词—亦称标题,指经过规范化处理 的,用来标引文献的词或词组,通常为 比较定型的事物名称。 美国国会标题表基本标题类型 (Lbrary of Congress of Congress Sbject Heading) Library (图书馆 ─单词标题) English literature (英语文学─形容词词组标题) Children in motion pictures(电影中的儿童─介词词组标题) Literature and science (文学与科学─连词词组标题) Chemistry, Organic (有机化学 ─倒置标题) Cookery (Frozen food)(冷冻食品的烹调─带限定词的标题) Reference books—Bibliography(参考书—书目─复分标题) 副标题、复分标题 • 自由浮动通用复分表( FreeFloating Subdivisions): – 供特定范畴如:人物、种族、团体、 人名、地名、河流等使用; • 示范标题: – [ Personal name] in fiction,drama, poetry,etc. – [Topic or place] in literature – [Topic or place] in art
标题法的参照 标题法主题法特点与不足 特点 早期只限于 采用列举式词表,形式直 定组式标题结构固定,食义明确 见参照}—揭示等同关系 按照调列举的标属和副标进行标引,操作 参见参照—揭示等级、相关关系 主通过以参顺方式揭示标题之闻的相关性。 《美国国会图书馆标题表》(LCSH)自 1988年开始也使用了类似叙词法的参照 定组式标,无法多元检囊〔手工系统中 2元词法 3叙词法 元词一指用来标引文献主题的、最基本的、 字面上不能再分的语词 叙词亦称主题词,是经过规范化处 文献”、“分类”、“主题”、“标引”——元词: 理的,以基本概念为基础的表达文献主 文献分类”、“主题标引”非元词 题的词和词组 元词法一以元词作为主题标识,通过字面 叙词法以叙词作为文献主题标识 组配的方式表达文就主题的主题法 过概念组配方式表达文献主题的主题 法类型 叙词法与元词法的不同 司对h它的收 其它检索语言技术 叙词语言技术 其一,语词的形式不同。元词法只用单元 体系分类法学科分类 范畴索引 词,叙词法同时收词组。 等级结构 族索引 洋细分类词表 仪表 分面分类语言分面组配 概念组 其二,组配的依据不同。元词法:按照字 面组配对复合主题分拆和相加;叙词法 标题语言 依据概念关系对复合主题进行分解和组 见参照、参见参照 配 元词语言 如主题“生物物理学”,元词法标引为:生物 完全后组 基本后组 法标引为:“生物学”、“物理 反记法 倒排档 关键词语言轮排技术 轮排索引
2 标题法的参照 • 早期只限于: – 见参照|——揭示等同关系 – 参见参照——揭示等级、相关关系。 • 《美国国会图书馆标题表》( LCSH)自 1988年开始也使用了类似叙词法的参照 方式。 标题法主题法特点与不足 特点: – 采用列举式词表,形式直观; – 定组式标题结构固定,含义明确; – 按照词表列举的标题和副标题进行标引,操作 简便; – 主通过以参照方式揭示标题之间的相关性。 不足: – 收词量大; – 专指度不足; – 修订量大; – 定组式标题,无法多元检索(手工系统中)。 2.元词法 元词—指用来标引文献主题的、最基本的、 字面上不能再分的语词。 “文献”、“分类”、“主题”、“标引”——元词; “文献分类”、“主题标引”——非元词。 元词法—以元词作为主题标识,通过字面 组配的方式表达文献主题的主题法。 3.叙词法 • 叙词——亦称主题词,是经过规范化处 理的,以基本概念为基础的表达文献主 题的词和词组。 • 叙词法——以叙词作为文献主题标识, 通过概念组配方式表达文献主题的主题 法类型。 叙词法与元词法的不同 其一,语词的形式不同。 元词法只用单元 词,叙词法同时收词组。 – 例:主题“工业仪表”,元词法标引:“工业”、 “仪表”,叙词法标引:“工业仪表”。 其二,组配的依据不同。元词法:按照字 面组配对复合主题分拆和相加;叙词法: 依据概念关系对复合主题进行分解和组 配。 – 如主题“生物物理学”,元词法标引为:生物、 物理学;叙词法标引为:“生物学”、“物理 学” 叙词语言对其它检索语言技术的吸收 其它检索语言 技 术 叙词语言技术 体系分类法 学科分类 等级结构 范畴索引 词族索引 详细分类词表 分面分类语言 分面组配 概念组配 分面词表 标题语言 先组 见参照、参见参照 适当先组 用、代、属、分、参参照 元词语言 字面组配 完全后组 反记法 概念组配 基本后组 倒排档 关键词语言 轮排技术 轮排索引 (引自《主题法导论》)
叙词法的特点与问题 关键词法 特 关键词法直接以自然语言中未经控制或只作少量控制的语词为 (1)概念组配,能准确揭示主题 文献主题标识,标引和检索的方法 (2)通过参照系统和索引,对词汇有效控制 例:早期的机编关键词索引,目前的文本检索系统。下面是题 (3)多途径检索,可采用灵活组配方式及对词间联系 名关键词索引的例子 充分揭示检索 (4)同时适用于多种方式,包括:标识单元和文献单 佥索入口 元检索方式,机检和手检。 (1)词表编制和管理的难度大,花费较多人力、物力 (2)文献标引须在概念分析的基础上进行,标引难度 大 弱智儿童的游戏疗法小学中300 关键词特点和不足 主题语言类型:先组式与后组式 特点 掌机进行标引或处理,速度快,成 先组式检素语言指在标引阶段,复杂主题的标 本低,词汇更新及时; 识在系统中就已经按一定方式组好了的一种标 专指性优于标题语言和叙词语言 引和检崭的语言。如:标题法。 本表达质量的影响,检索质量不稳 后组式检宗语言指检前,复杂主题的标识在 检索系统中是以基本念的形式独立存在的,实 缺乏词汇控制 施检索时,才很捐检案提问进行组合检亲语言 中文关键词计算机抽词标引需要词表。 包括:元词法、叙词法 主题语言类型:受控语言与自然语言 主题法类型 受控语言—指经过词汇控制的标识系 搜选择的词汇 按黑组聚先后 是否制 统。包括;分类法、标题法、叙词法。 自然语言—直接使用文就用词或检囊 标法 先式主法 词为标识的系统。包括:关健词法、自 由标引、自动标引、自然语言文本检索 后解击氯法 旱期为非控主 受控与自然语言结合形式,包括:受控 标引结合自由标引、自由标引+后控检 后成散組式主黑法受控的主题法 关调 后解主愿法 非控主
3 叙词法的特点与问题 特点 (1)概念组配,能准确揭示主题。 (2)通过参照系统和索引,对词汇有效控制。 (3)多途径检索,可采用灵活组配方式及对词间联系 充分揭示检索。 (4)同时适用于多种方式,包括:标识单元和文献单 元检索方式,机检和手检。 不足: (1)词表编制和管理的难度大,花费较多人力、物力; (2)文献标引须在概念分析的基础上进行,标引难度 大 。 关键词法 关键词法直接以自然语言中未经控制或只作少量控制的语词为 文献主题标识,标引和检索的方法。 例:早期的机编关键词索引,目前的文本检索系统。下面是题 名关键词索引的例子: * 检索入口 法/小学中 弱智儿童的游戏疗 3000 小学中弱智 儿童的游戏疗法/ 3000 儿童的游戏 疗法/小学中弱智 3000 游戏疗法/ 小学中弱智儿童的 3000 弱智儿童的 游戏疗法/小学中 3000 关键词特点和不足 特点: • 可以使用计算机进行标引或处理,速度快,成 本低,词汇更新及时; • 专指性优于标题语言和叙词语言。 不足 • 容易受到文本表达质量的影响,检索质量不稳 定; • 缺乏词汇控制。 • 中文关键词计算机抽词标引需要词表。 主题语言类型:先组式与后组式 先组式检索语言——指在标引阶段,复杂主题的标 识在系统中就已经按一定方式组配好了的一种标 引和检索的语言。如:标题法。 后组式检索语言——指检索前,复杂主题的标识在 检索系统中是以基本概念的形式独立存在的,实 施检索时,才根据检索提问进行组合检索语言。 包括:元词法、叙词法。 主题语言类型:受控语言与自然语言 受控语言——指经过词汇控制的标识系 统。 包括:分类法、标题法、叙词法。 自然语言——直接使用文献用词或检索 词为标识的系统。包括:关键词法、自 由标引、自动标引、自然语言文本检索。 受控与自然语言结合形式,包括:受控 标引结合自由标引、自由标引+后控检 索 主题法类型 按照选择的词汇 按照组配先后 按照是否控制 标题法 先组式主题法 受控的主题法 元词法 后组式主题法 早期为非控主题法 叙词法 后组或散组式主题法 受控的主题法 关键词法 后组式主题法 非控主题法
第二节叙词表的结构 叙词表结构组成 叙词表是一种将标引人员或用户的 按照其显示方式 自然语言转换成规范化语言的术语控制 字顺显示 工具;是概括各门或某一学科领域并由 系统显示 词义相关、语义相关的术语组成的可以 图形显示 不断补充的规范化词典 ·按照各组成部分的性质,包括 从结构组成看,是对术语之间各种词义联 字顺表 系进行显示的词汇系统 附表 从功能看,将自然语言转换成规范化语言 辅助素引等 的术语控制工具 字顺显示 1字顺表 字顺表一由叙词款目和非叙词款目按字 字顺主表 顺排列的一览表。亦称为主表。 2专类复分表 3入口词表 叙词款目一由叙词及其相关语义关系项 构成的独立排检单位,包括正式叙词 4叙词式 款目和非叙词款目 5双语种词表 叙词款目组成一包括:款目词项、标记 项、注释项、参照项 wve zhengce-汉语拼音 钗词——农业政策 05B—范畴号 Agncultural policy-英文译名 Nongye fangzhen zhengce 汉语拼音 D农业方针政策一一非叙 非叙词——农业方针政策 05A范赙号 F副业政 Agricultural programand poli 粮食政策 用项一 Y农政策 汉词 林业政策 土地政 畜牧业政策 上位词 一族首词 C农村经济政策 农业法令 农业发展路线 》司款且,趔
4 第二节 叙词表的结构 • 叙词表——是一种将标引人员或用户的 自然语言转换成规范化语言的术语控制 工具;是概括各门或某一学科领域并由 词义相关、语义相关的术语组成的可以 不断补充的规范化词典。 – 从结构组成看,是对术语之间各种词义联 系进行显示的词汇系统; – 从功能看,将自然语言转换成规范化语言 的术语控制工具 。 叙词表结构组成 • 按照其显示方式 – 字顺显示 – 系统显示 – 图形显示 • 按照各组成部分的性质,包括 – 字顺表 – 附表 – 辅助索引等 一、字顺显示 1.字顺主表 2.专类复分表 3.入口词表 4.叙词索引 5.双语种词表 1. 字顺表 字顺表—由叙词款目和非叙词款目按字 顺排列的一览表。 亦称为主表。 叙词款目—由叙词及其相关语义关系项 构成的独立排检单位,包括正式叙词 款目和非叙词款目。 叙词款目组成—包括:款目词项、标记 项、注释项、参照项。 Nongye zhengce──汉语拼音 叙词── 农业政策 05B──范畴号 Agricultural policy──英文译名 代项── D 农业方针政策──非叙词 分项── F 副业政策 粮食政策 ────下位词 林业政策 土地政策 畜牧业政策 渔业政策 属项── S 经济 ────上位词 族项── Z 政策 ────族首词 参项── C 农村经济政策 农业法令 ────相关词 农业发展路线 《汉表》叙词款目样例 Nongye fangzhen zhengce ────汉语拼音 非叙词──农业方针政策 05A──范畴号 Agricultural program and policy ──英文译名 用项── Y 农业政策 ──叙词 《汉表》非叙词款目样例
字顺表款目的有关概念 字顺索引与入口词表 款目词—款目中起标目作用的词。汉语叙词 表中,款目词项往往包括汉语拼音和对应的外 字顺索引仅收入叙词、非叙词,非叙 标记项一记录款目词的序号以及款目词所属范 词含有用项参照,其余项目一概不收。 注释 目词的补充说明,包括含义注 入口词表是由非叙词单独编制的表, 历史注释及用法注释等,用于明确款目词的含 义、用法和变动等 收入词表编制或标引中出现的按等同关 义关系参照项 般根据语义情况依次设置 系处理的非叙词(包括未收入词表的其 族、参各项参照。非叙词下只设 它非叙词),用以提高检全率。 用项,用于指向相应的叙词 2.专有叙词表(1) 3.双语种索引 双语种黨引——是一种将全部叙词及非叙词与相应外语译名相互对 专有叙词表—亦称附表,是将众多专有名词按 外文译名字顺排列的索引,是通过外文译名使用词表的辅 缩小主变的篇幅 分类显示的作用,可从范畔出发查 及时管理或增补 主分析 《汉表》的专有叙词表:“世界各国政区名称” 主目录 自然地理区划名称”、“组织机构和“人物” 《铁路汉语主题词表》专有叙词表:根据专业的 标法(主法 点或需要,设有地名、机构、型号、路名等 专有叙词表在确有必要时才编制,否则会造成词 Subject indexing 表结构的分散。 主引 二、系统显示 1.范畴索引 通过将叙词按照一定的关系加以组织,以 范囀案引—亦称分类索引,范畸表,是一种按 清足从不同角度查找叙词的显示方式 照词汇所属学科或范喇编制的概略分类系统 是从分类角度查找叙词的辅助工具 包括: 范索引作用 畴索引 ①便于从分类角度查找与某一范有关的叙 轮排索引 ②可以作为类分文献的依据 分类主题一体化词表 是编表时按类选词、确定词间关系、编制 参照系统等的工具
5 字顺表款目的有关概念 款目词——一款目中起标目作用的词。汉语叙词 表中,款目词项往往包括汉语拼音和对应的外 语译名。 标记项——记录款目词的序号以及款目词所属范 畴的号码。 注释项——款目词的补充说明,包括含义注释、 历史注释及用法注释等,用于明确款目词的含 义、用法和变动等。 语义关系参照项—— 一般根据语义情况依次设置 代、分、属、族、参各项参照。非叙词下只设 用项,用于指向相应的叙词。 字顺索引与入口词表 字顺索引——仅收入叙词、非叙词,非叙 词含有用项参照,其余项目一概不收。 入口词表——是由非叙词单独编制的表, 收入词表编制或标引中出现的按等同关 系处理的非叙词(包括未收入词表的其 它非叙词),用以提高检全率。 2. 专有叙词表(1) 专有叙词表——亦称附表,是将众多专有名词按 字顺排列的表。作用: – 缩小主表的篇幅; – 分类显示的作用,可从范畴出发查词; – 及时管理或增补。 《汉表》的专有叙词表:“世界各国政区名称”、 “自然地理区划名称”、“组织机构”和“人物” 。 《铁路汉语主题词表》专有叙词表:根据专业的 特点或需要,设有地名、机构、型号、路名等。 专有叙词表在确有必要时才编制,否则会造成词 表结构的分散。 3. 双语种索引 双语种索引——是一种将全部叙词及非叙词与相应外语译名相互对 应、按外文译名字顺排列的索引,是通过外文译名使用词表的辅 助工具。 Subject 主语 主体 Subject analysis 主题分析 Subject catalogue 主题目录 Subject heading 标题法 (Y 主题法) Subject index 主题索引 Subject indexing 主题标引 二、系统显示 通过将叙词按照一定的关系加以组织,以 满足从不同角度查找叙词的显示方式。 包括: – 范畴索引 – 词族索引 – 轮排索引 – 分类主题一体化词表 1. 范畴索引 范畴索引——亦称分类索引,范畴表,是一种按 照词汇所属学科或范畴编制的概略分类系统, 是从分类角度查找叙词的辅助工具。 范畴索引作用: ①便于从分类角度查找与某一范畴有关的叙 词。 ②可以作为类分文献的依据 。 ③是编表时按类选词、确定词间关系、编制 参照系统等的工具
范畴索引的编制类目设置 范畴索引的编制类目的排列 以学科分类为基础,结合专业分类和词 汇分类的特点进行。 其一,按类目内容关系组织,类似等级分类体 根据词汇特点设类。如“一般概念”类的设 系。我国词表大多采用这一方式 置,如《汉表》中设有“哲学一般概念” 其二,按类名字顺组织,即先将一级类目按字 “政治一般概念”等类目。 顺组织,再在同一级类目下按字顺序列二级 类目的等级视词汇情况而定。多数词表 类目。国外如TEST等词表使用此方式 只限于二、三级。 类下的叙词按字顺排列 范畴索引编制一标记符号 范畴索引编制一词汇处理 号码种类,包括 收入字顺表全部款目词,包括叙词和非叙词。 以字母、数字为基本成分的单纯号码 一类目的词量,一般控制在40-100词左右 字母与数字结合的混合号码等种类。 原则上一词一类:一词如具有两个或两个以上 编号制度—一般为层累方式,即以 范属性,同时在不同学科门类重复反映 个标记单元标示一次划分,号码既表示 例:《汉表》中叙词“矿业经济”,同时归入“05HB 工业部门”和“05PB矿业经济”两类 类目的次序,又可以表示类目划分的等 又例:主题词“社会制度”,同时归入“02E历史观” 级及联系 “03BC国家理论”和“12A历史一般概念”三个门类 《汉》范素引“07文化事业类目结构例 2.词族索引 07文化事业 一级类目 07A文化事业一般概念 词族 组具有属分关系的叙词按族系关系组织 07B社会文化工作 二级类目 的词汇集合 07J图书馆 族首词—族叙词中,外延最广的叙词 07JA图书馆一般概念 三级类目 词族索引——亦称等级索引,指将众多词族按族首 07JB图书馆类型 词(款目词)字顺组织编制的索引 版本图书馆 词族紫引的作用是 部队图书馆 ①可从词族出发查 由扩大或缩小查找范围 藏书楼 按字顺排列的叙词 改善标引和检索的 厂矿图书馆 大学图书馆 ②可在计算机检索系统中,自动进行上位词登录 Y院校图书馆 ③可通过等级关系限定词义
6 范畴索引的编制—类目设置。 – 以学科分类为基础,结合专业分类和词 汇分类的特点进行。 – 根据词汇特点设类。如“一般概念”类的设 置,如《汉表》中设有“哲学一般概念”、 “政治一般概念”等类目。 – 类目的等级视词汇情况而定。多数词表 只限于二、三级。 范畴索引的编制—类目的排列 其一,按类目内容关系组织,类似等级分类体 系。我国词表大多采用这一方式 其二,按类名字顺组织,即先将一级类目按字 顺组织,再在同一级类目下按字顺序列二级 类目。国外如TEST等词表使用此方式。 类下的叙词按字顺排列。 范畴索引编制—标记符号 • 号码种类,包括: – 以字母、数字为基本成分的单纯号码 – 字母与数字结合的混合号码等种类。 • 编号制度——一般为层累方式,即以一 个标记单元标示一次划分,号码既表示 类目的次序,又可以表示类目划分的等 级及联系。 范畴索引编制—词汇处理 • 收入字顺表全部款目词,包括叙词和非叙词。 • 一类目的词量,一般控制在40-100词左右。 • 原则上一词一类;一词如具有两个或两个以上 范畴属性,同时在不同学科门类重复反映。 – 例:《汉表》中叙词“矿业经济”,同时归入“05HB 工业部门”和“05PB 矿业经济”两类。 – 又例:主题词“社会制度”,同时归入“02E 历史观”、 “03BC 国家理论”和“12A 历史一般概念”三个门类。 《汉表》范畴索引“ 07 文化事业”类目结构样例 07 文化事业 一级类目 07A 文化事业一般概念 07B 社会文化工作 二级类目 07J 图书馆 07JA 图书馆一般概念 三级类目 07JB 图书馆类型 版本图书馆 部队图书馆 藏书楼 按字顺排列的叙词 厂矿图书馆 大学图书馆 Y 院校图书馆 ........... 2. 词族索引 词族——一组具有属分关系的叙词按族系关系组织 的词汇集合。 族首词——一族叙词中,外延最广的叙词。 词族索引——亦称等级索引,指将众多词族按族首 词(款目词)字顺组织编制的索引。 词族索引的作用是: ①可从词族出发查词,自由扩大或缩小查找范围, 改善标引和检索的效果。 ②可在计算机检索系统中,自动进行上位词登录。 ③可通过等级关系限定词义
汊语拼青 Guomin inje bameng gechen 3.轮排索引 款目叔词—国民经济部门构成 轮排素 非物质生产部门 将叙词、非叙词按词素的字顺排列, (族首词) 含有同一词素的词组集中显示于一处的词汇表 服务部门 城市公用事业 轮排索引的作用是可以帝助: 等级符号 OM范畴号 ①增加检入口。便于从词素角度出发查找词组, 社会福利事业 ②专指叙词选择。将具有同一词素的叙词集中在 于用户通过判断,选择最为专指的叙 物质生产部门 ·物资供应部门 ③词间关系处理。有助于利用词面成族的特点 见遗漏的词汇或词间关系处理中存在的问题 社金利学部分目 以便加以改进。 轮排索引—一对叙词处理特点 文藏标引 (1)收词范围。可以只收词组叙词和非叙词 分类要引主题每类标 也可以收入全部叙词和非叙词,包括单 语言 分类言 分类言 词、词组。 检索语言 (2)轮排数量。每个叙词根据其构成词素, 主题检索 确定。例:“轻型载重汽车”,可分别按 检索,主题 献标 文献分 “轻型”、“载重”、“汽车”等三个词素作入 文献检索 问标啊 口,对条目进行轮排。 叙呵语言 言:夯 (3)显示方式。大致有词外轮排、词内轮排 权词语言 倒置轮排三种。 生意标喜 百: 4.分类主题一体化词表 分类主题一体化语言的作用 快含女 现分类语言和主 (1)可同时作为分类标引和主题标引的工具,两种标 一个检素语言 引数据可以相互转换,从而节省人力物力 (2)可以通过它,在一个检索系统中同时进行分类检 索和主题检索,充分利用两者的优点,改进检索效 分类主题一体化词表三种类型: (3)可通过两者的结合,改进和完善对类表的编制,包 括改进词汇选择、词间关系构造,改进词表编制的 -分类主题词表 集成词表 (4)可以成为不同检索语言之间兼容互换的工具
7 汉语拼音-------- Guomin jinjie bumeng gechen 款目叙词-------- 国民经济部门构成 05HB (族首词) ·非物质生产部门 05HB ··服务部门 05HB ···城市公用事业 05HB 等级符号 ------- ···服务业 05QM------范畴号 ···社会福利事业 03JG ··管理部门 03HB ···行政部门 03HB ·物质生产部门 03HB ··物资供应部门 03HB 《汉表》社会科学部分词族款目 3. 轮排索引 轮排索引——将叙词、非叙词按词素的字顺排列, 含有同一词素的词组集中显示于一处的词汇表。 轮排索引的作用是可以帮助: ①增加检索入口。便于从词素角度出发查找词组, 提高查词的速度。 ②专指叙词选择。将具有同一词素的叙词集中在 一起,有助于用户通过判断,选择最为专指的叙 词用于标引。 ③词间关系处理。有助于利用词面成族的特点, 发现遗漏的词汇或词间关系处理中存在的问题, 以便加以改进。 轮排索引——对叙词处理特点 ⑴收词范围。可以只收词组叙词和非叙词, 也可以收入全部叙词和非叙词,包括单 词、词组。 ⑵轮排数量。每个叙词根据其构成词素, 确定。例:“轻型载重汽车”,可分别按 “轻型”、“载重”、“汽车”等三个词素作入 口,对条目进行轮排。 ⑶显示方式。大致有词外轮排、词内轮排、 倒置轮排三种。 词外轮排 词内轮排 倒置轮排 标引 标引语言 分类标引 文献标引 叙词标引 主题标引 分类 分类标引 分类检索 分类语言 文献分类 检索 分类检索 检索语言 文献检索 主题检索 文献 文献标引 文献分类 文献检索 叙词 叙词标引 叙词语言 语言 标引语言 分类语言 检索语言 叙词语言 主题语言 主题 主题标引 主题检索 主题语言 标引语言 分类 标引 文献 标引 叙词 标引 主题 标引 分类标引 分类检索 分类语言 文献 分类 分类 检索 检索语言 文献 检索 主题 检索 文献标引 文献分类 文献检索 叙词标引 叙词语言 标引 语言 分类 语言 检索 语言 叙词 语言 主题 语言 主题标引 主题检索 主题语言 标引语言 标引,分类 标引,文献 标引,叙词 标引,标引 分类标引 分类检索 分类语言 分类,文献 检索,分类 检索,文献 检索,语言 检索,主题 文献标引 文献分类 文献检索 叙词标引 叙词语言 语言,标引 语言,分类 语言,检索 语言,叙词 语言,主题 主题标引 主题检索 主题语言 叙词轮排索引轮排形式样例 4. 分类主题一体化词表 分类主题一体化词表——是一种实现分类语言和主 题语言兼容互换的系统。通常在一个检索语言 系统中,对分类表部与主题词表部的术语、参 照、标识、索引四部分实施统一的控制,以满 足分类标引、主题标引的需要。 分类主题一体化词表三种类型: – 分面叙词表; – 分类主题词表; – 集成词表。 分类主题一体化语言的作用 (1)可同时作为分类标引和主题标引的工具,两种标 引数据可以相互转换,从而节省人力物力; (2)可以通过它,在一个检索系统中同时进行分类检 索和主题检索,充分利用两者的优点,改进检索效 果; (3)可通过两者的结合,改进和完善对类表的编制,包 括改进词汇选择、词间关系构造,改进词表编制的 质量和统一管理等。 (4)可以成为不同检索语言之间兼容互换的工具
中国分类主题词》分类号一主题词对应表样例 《中国分类主题词表》的结构组成 F84保险 F840保险理论 保险经济论 F840.3保险组织和管理保险业一织:保险业一嶝济管 1、分类号一主题词对应表 F840.4保险业务 保险业务 2、主题词一分类号对应表 保险时:保险费:保险合同;保险金额:理赔 F840.6各种类型保险保险类盈 F840.61劳动保险 劳动保险费用:[退休金]:失业保险 F840.62人身保险 人身保险金:旅游保险:人寿保险 分类号主题词对应表编制 1.类目与主题词的对应,以《中图法》的类目 保证保险 保障和赔偿保险 2.首先列出与类名概念对应的主题词,同时列 人身保险 出类目注释中的概念对应的主题词和类目包括 的主题词 养老医疗保险 类目对应的主题词必须是主题词表中相对应 的正式主题词或主题词组配形式 天探险 每个主题词均根据其属性,归入相应知识门 题词“工业企业”分别在F406 保险一论 F840.6;F840.69 摄影机 三.图形显示 图形显示—指将叙词之间关系以 物摄影机 动画摄影机立体摄影机本下摄影机 维图形式加以显示,亦称词族图。 包括 T 树形结构图 即刻成像微型景区反射式电视 摄影机摄影机摄影机摄影机 摄影机 箭头关系图。 35毫米单镜头 水下电影 方框图。 摄影 反射式摄影机反射式 树形结构图《引自《单语种叙词表编制与修订准则》1981)
8 《中国分类主题词表》的结构组成 《中国分类主题词表》的结构组成 1、分类号—主题词对应表 2、主题词—分类号对应表 《中国分类主题词》分类号—主题词对应表样例 F84 保险 保险 保险业 F840 保险理论 保险—经济理论 保险学 F840.3 保险组织和管理 保险业—组织;保险业—经济管理 保险公司 F840.4 保险业务 保险业务 保险时;保险费;保险合同;保险金额;理赔 F840.6 各种类型保险 保险—类型 F840.61 劳动保险 劳动保险 劳动保险费用;[退休金];失业保险 F840.62 人身保险 人身保险 人身保险金;旅游保险;人寿保险 分类号主题词对应表编制 1.类目与主题词的对应,以《中图法》的类目 为基础。 2.首先列出与类名概念对应的主题词,同时列 出类目注释中的概念对应的主题词和类目包括 的主题词。 3.类目对应的主题词必须是主题词表中相对应 的正式主题词或主题词组配形式。 4.每个主题词均根据其属性,归入相应知识门 类之下。多属性主题词,可在多个对应类目中 列出。例:主题词“工业企业”分别在F406和 F406.9两类下列出。 《 中 国 分 类 主 题 词 表 》 主 题 词 — 分 类 号 对 应 表 保鲜剂 TQ459⑦ 保险 F84 · 保证保险 ·· 保障和赔偿保险 ·· 信用保险 · 人身保险 ·· 健康保险 ··· 医疗保险 ···· 养老医疗保险 ·· 旅游保险 ·· 人寿保险 Z 部 门 经 济 保险—国际组织 F841.3 保险—经济理论 F840; F840.69 保险—类型 F840.6; F840.69 三. 图形显示 图形显示——指将叙词之间关系以 二维图形式加以显示,亦称词族图。 包括: 树形结构图。 箭头关系图。 方框图。 摄影机 静物摄影机 动画摄影机 立体摄影机 水下摄影机 即刻成像 微型 景区 反射式 电视 电影 摄影机 摄影机 摄影机 摄影机 摄影机 摄影机 35毫米 单镜头 双镜头 水下电影 摄影机 反射式摄影机 反射式摄影机 摄影机 树形结构图(引自《单语种叙词表编制与修订准则》1981)
四.关于叙词表的组成模式 第三节词汇控制 1叙词表虽然总体上由上述三种显示方式组成 但一部具体的词表,不必包括所有部分 2.一部功能完善的叙词表至少应包括两部分:其 为字顺显示部分,其二为系统显示部分,包 、词形控制、词义控制 括范畴表或分类表等 三、词间关系控制 3.一个好的词表应努力追求的特点是功能完备 结构简明。 词汇选择 词汇选择——词汇选择原则 (1)应从标引和检索的实际需要出发,并考 虑各学科的现状及发展 1.词汇选择原则 (2)概念明确,一词一义,符合科学性 通用性的特点,适宜表达文献主题和检 2.词汇类型 索提问。对同形异义词、多义词限定。 3)应发挥组配的优越性,又兼顾词汇专 3.词组的选择 指性,同时收入单词和词组 (4)词形上符合语词标识的要求,尽量选 用便于字面成族的词。 、词汇选择——词类范围 、词汇选择—专有名词 以名词为主,也收少量形容词。包折還名词、专有名调 专有名词—用以表达某一单一事物名称的词。叙 (1)表示物的名词术语,如商品、玉米、棉花、车床、计算机等 (2)表示物啊的名词术语,如水泥、塑料、橡胶、人造纤维、感光材 词表选择的专有名词包括: 自然地理区划名 (3)表示事物性质、现象、状态、过等方面的名词术语,如稳定性、导 治区划 电性、老化、流、疲劳、振动等 (4)表示研究方法、工艺等的名词术语,如分析、调查、总结、数学模拟、 机关团体名 热处理、焊接等 (表示单科的名词术语,如经济学、人口学、物理学、化学、生物学 历史事件名 产品型号名 (6)表示复类的名词术语,如词典、百科全书、年鉴、期刊、手册 目录、索引、会议录等 文就名等
9 四. 关于叙词表的组成模式 1.叙词表虽然总体上由上述三种显示方式组成, 但一部具体的词表,不必包括所有部分。 2.一部功能完善的叙词表至少应包括两部分:其 一为字顺显示部分,其二为系统显示部分,包 括范畴表或分类表等。 3.一个好的词表应努力追求的特点是功能完备、 结构简明。 第三节 词汇控制 一、词汇选择词 二、词形控制、词义控制 三、词间关系控制 一. 词汇选择 1.词汇选择原则 2.词汇类型 3.词组的选择 一、词汇选择——词汇选择原则 ⑴应从标引和检索的实际需要出发,并考 虑各学科的现状及发展。 (2)概念明确,一词一义,符合科学性、 通用性的特点,适宜表达文献主题和检 索提问。对同形异义词、多义词限定。 (3)应发挥组配的优越性,又兼顾词汇专 指性,同时收入单词和词组。 (4)词形上符合语词标识的要求,尽量选 用便于字面成族的词。 一、词汇选择——词类范围 以名词为主,也收少量形容词。包括普通名词、专有名词。 ⑴表示事物的名词术语,如商品、玉米、棉花、车床、计算机等。 ⑵表示事物材料的名词术语,如水泥、塑料、橡胶、人造纤维、感光材 料等。 ⑶表示事物性质、现象、状态、过程等方面的名词术语,如稳定性、导 电性、老化、流通、疲劳、振动等。 ⑷表示研究方法、工艺等的名词术语,如分析、调查、总结、数学模拟、 热处理、焊接等。 ⑸表示学科的名词术语,如经济学、人口学、物理学、化学、生物学、 遗传学、分子生物学、环境科学等。 ⑹表示文献类型的名词术语,如词典、百科全书、年鉴、期刊、手册、 目录、索引、会议录等。 一、词汇选择——专有名词 专有名词——用以表达某一单一事物名称的词。叙 词表选择的专有名词包括: – 自然地理区划名 – 政治区划名 – 机关团体名 – 人名 – 历史事件名 – 产品型号名 – 文献名等
先组度控制 先组度控制 后组词一以单一概念形式收入词表的词,即 元词的作用一减少词量,增加检索入口,提高检 全率 先组词一直接以复合概念形式收入词表的词 不足,a使用过多,影响标引的直接性:b有 即词组 些词通过标引表达,会产生二义性:C无法 揭示一些常用主题概念之间的关系 先组度控制一指对词表中收入先组词数量进 先组词的作用一增加检准率:揭示主题概念之间 关系:问题一增加词量,提高管理费用 先组词与词间关系揭示 先组度控制——选用的词组 化学工业 (1)使用频率较高的常用词组 环境工程、高 F化肥工业 合成工业 2)词组分解后单词含义发生变化 、户三拥的 合成洗涤工业 合义发生变化,应直接选入 塑料工业 后基牛的一方失去意义,如,剩余价 橡胶工业 (组配表达会产生二义性时,如工业橡胶、工业 制药工业 S重工业 6有标引价值的专有名词 如果南能期:, Z工业 义会发生变化 二、词形控制与词义控制 词形控制与词义控制一同义控制 即对一义多调现象进行控制,使其一义一词。一般选其中 指根捐主题标引和检的需妥对语词形式及一 义多词、一词多义现象作出规定,使得实现 语义同义词。以较通用的词作叙词 词一义、一义一词。 太阳能水加热器(叙词)太阳能热水器(入口词) 学名与俗名。以学名为叙词 包谷(入口词)玉蜀季(入口 同义词控制、 不同角度的名称之间。一般选较常用的词为叙词 海公报(叙词)中美联合公报(入口词) 新称与旧称。以新称为叙词 例:壮族(叙词)僮族(入口词)
10 先组度控制 后组词— 以单一概念形式收入词表的词,即 元词。 先组词—直接以复合概念形式收入词表的词, 即词组。 先组度控制—指对词表中收入先组词数量进 行控制 先组度控制 元词的作用—减少词量,增加检索入口,提高检 全率; 不足,a使用过多,影响标引的直接性;b有 一些词通过标引表达,会产生二义性;C无法 揭示一些常用主题概念之间的关系。 先组词的作用—增加检准率;揭示主题概念之间 关系;问题—增加词量,提高管理费用。 先组词与词间关系揭示 化学工业 F 化肥工业 合成工业 合成洗涤工业 塑料工业 橡胶工业 制药工业 S 重工业 Z 工业 先组度控制——选用的词组 ⑴使用频率较高的常用词组。如:环境工程、高 等教育、工业政策、化学工业等 。 ⑵词组分解后单词含义发生变化。如:燃料电 池、猎户星座二词分解后,燃料、猎户二词的 含义发生变化,应直接选入。 ⑶词组分解后其中的一方失去意义。如:剩余价 值、台面二极管。 ⑷组配表达会产生二义性时,如工业橡胶、工业 仪表 ⑸有标引价值的专有名词,一般直接使用。如北 京大学、北京图书馆等,如采用组配标引,含 义会发生变化。 二、词形控制与词义控制 指根据主题标引和检索的需要对语词形式及一 义多词、一词多义现象作出规定,使得实现 一词一义、一义一词。 包括: 规定语词形体、 同义词控制、 词义控制。 二. 词形控制与词义控制—同义控制 即对一义多词现象进行控制,使其一义一词。一般选其中一 个为叙词,其余为非叙词。 • 语义同义词。以较通用的词作叙词。 例: 太阳能水加热器(叙词) 太阳能热水器(入口词) • 学名与俗名。以学名为叙词。 例:玉米(叙词) 包谷(入口词) 玉蜀黍(入口 词) • 不同角度的名称之间。一般选较常用的词为叙词。 上海公报(叙词) 中美联合公报(入口词) • 新称与旧称。以新称为叙词 。 例:壮族(叙词) 僮族(入口词)