第五章自动标引
1 第五章 自动标引
本章内容提要 口旬动标引基本原理 自动标引的主要方法和技术 汉语旬动标引
2 本章内容提要 ◼ 自动标引基本原理 ◼ 自动标引的主要方法和技术 ◼ 汉语自动标引
第一节自动标引的基本原理 自动标引的定义、类型 自动标引的意义 自动标引的流 自动标引的原理
3 第一节 自动标引的基本原理 ◼ 自动标引的定义、类型 ◼ 自动标引的意义 ◼ 自动标引的流程 ◼ 自动标引的原理
1自动标引的定义 自动标引( Automatic Indexing),又称计 算机辅助标引( Computer Aided Indexing),是根据文献内容,依靠计算机 糸统全部或部分地自动给出标引行号的过 口换句话说,就是利用计算机糸统模仿人的 标引话动并自动生成情报检索所需的索引 符号的过程
4 1 自动标引的定义 ◼ 自动标引(Automatic Indexing),又称计 算机辅助标引(Computer Aided Indexing),是根据文献内容,依靠计算机 系统全部或部分地自动给出标引符号的过 程。 ◼ 换句话说,就是利用计算机系统模仿人的 标引活动并自动生成情报检索所需的索引 符号的过程
2自动标引的类型 口按人工介入与否分为金旬动标孔与半自动 标引。 口按标引词来源分为自动抽词标引与自动赋 词标引
5 2 自动标引的类型 ◼ 按人工介入与否分为全自动标引与半自动 标引。 ◼ 按标引词来源分为自动抽词标引与自动赋 词标引
CSIRS基于概念空间的信息检索系统 文件自动处理概念空间系毵 丁开文件预处理抽训标吲受控标吲白动分 待处理文本 标引结果 抽词标引結果 关键词 主题词: 息作出乐 德 o机构书 者3 喬晶的 的嵌元符答欧洲的莉益 赋词标引结果 18.57T324 停森隆 投资者 3. 000000 分类结果 290.T5T3s 迎族数慰 如果从2日日
6
强CSR5筛词检索- Microsoft Internet Explorer 中后退·④的备说搜索回收藏夹媒体③③·回B回 地址(D)hp2219585494860 owe. asp?word=15 转到 Google CSIRS 筛词检索 关键词查找 关键词维护 主题词维护 积念空间维护 欧菜雅公司 欧美地区 美各国 欧美关系 欧美国家 欧美市 欧盟 欧盟成员国 欧盟东扩 欧盟法 欧盟经济 欧盟一体化 欧佩克 欧佩克成员国 欧式期权 欧亚大陆桥元发行 元汇率 欧元启动 欧元区经济欧元运行 欧元走势 欧洲标准 欧洲大市场欧洲单一货1 欧洲地区 欧洲电信标准 欧洲各国 欧洲共同市场 欧洲拱同体 欧洲国家 欧洲经合组织 洲联 欧洲人 欧洲统 洲政治 欧洲质量奖洲中央银行 洲资本市场 偶然事件 偶然性 耦合器 禺合作用 凶网页上有错误 . Internet
7
C5IRs筛词检索- Microsoft Internet Explorer 件()编辑(查看0收藏工具(D帮助 中后退·→·⑨的益搜索囟收藏夹守媒体(·身·回季回 地址①))t0:19525494160107d%c9%C0%D2%%D2%%D0%D0%8%4%8% ◇转到Goge·「 CSIRS 筛词检索 关键词查找 关键词浏览 关键词维护 主题词维护 概念空间维护 您输入的检索词是:商业银行改革 后 63418346354 8.36386662080925E-02 中击击击击 8.22119476371001E-02 6.32324012620214E-02 银行业 5.06841425388512E-02 5.02867338959348E-02 金融改革 产权制度改革 点击 点击 Concept space net 完毕 Internet
8
3旬动标引的意义 1.适应信息资源快速增长的需要 加利福尼亚大学伯克利分校研究人员发现,仅 199920024 出的信 新产生的信息中92%记录在硬盘等 碱存储介质上。 信息资源的快速增长,造成信息相对过剽。只 有提高信息组织的效率,才能摆脱信息相对过剩 带来的因惑,因此信息标引显得非常重要。自动 标引适应了这一需要
9 3 自动标引的意义 1.适应信息资源快速增长的需要 加利福尼亚大学伯克利分校研究人员发现,仅 1999-2002年的三年中,全球新生产出的信息量 就翻了一番。新产生的信息中92%记录在硬盘等 磁存储介质上。 信息资源的快速增长,造成信息相对过剩。只 有提高信息组织的效率,才能摆脱信息相对过剩 带来的困惑,因此信息标引显得非常重要。自动 标引适应了这一需要
3旬动标引的意义 2.相对手工标引存在很大优势,克服了手工标引难 以克服的缺点。 与熟练标引人员相比,自动标引的准确性不如手工 标引,但在其他指标方面旬动标引具有无可比拟 的优势: 处理能力强 处理速度快 >成本低 致性好,稳定性好
10 3 自动标引的意义 2.相对手工标引存在很大优势,克服了手工标引难 以克服的缺点。 与熟练标引人员相比,自动标引的准确性不如手工 标引,但在其他指标方面自动标引具有无可比拟 的优势: ➢处理能力强 ➢处理速度快 ➢成本低 ➢一致性好,稳定性好