
网络信息采集技术介绍 主讲:郭春燕
网络信息采集技术介绍 主讲:郭春燕

学习内容 网络信息采集技术介绍 学习内容 网络信息采集概述 网络信息采集技术的发展 网络信息采集软件的使用 主讲:郭春燕
学习内容 网络信息采集技术介绍 主讲:郭春燕 网络信息采集概述 网络信息采集技术的发展 网络信息采集软件的使用 学习内容

学习目标 网络信息采集技术介绍 学习目标 了解:网络信息采集系统的应用前景,常用网络信 息采集软件的种类 理解:网络信息采集的特点、原则,网络检索多媒 体技术的应用及检索工具的智能化发展 掌握:网络信息资源采集的质量标准、途径与策略 网络检索自动化技术的发展以及常用网络信息采集 软件的使用方法 主讲:郭春燕
学习目标 网络信息采集技术介绍 主讲:郭春燕 了解:网络信息采集系统的应用前景,常用网络信 息采集软件的种类 理解:网络信息采集的特点、原则,网络检索多媒 体技术的应用及检索工具的智能化发展 掌握:网络信息资源采集的质量标准、途径与策略, 网络检索自动化技术的发展以及常用网络信息采集 软件的使用方法 学习目标

网络信息采集技术介绍 网络信息采集概述 网络信息采集技术的发展 主讲:郭春燕
主讲:郭春燕 网络信息采集概述 网络信息采集技术的发展 网络信息采集技术介绍

网络信息采集概念 网络信息采集概念 网络信息采集是指从互联网共享服务资源中收集、处理和分析网络实体信 息的过程。网络信息采集不仅包括对互联网公共实体信息的查询和存储,还 包括对信息的归类、提取和解析,更重要的是在已收集信息的基础上分析数 据,并将分析结果用于实际问题的解决。 主讲:郭春燕
主讲:郭春燕 网络信息采集概念 网络信息采集概念 网络信息采集是指从互联网共享服务资源中收集、处理和分析网络实体信 息的过程。网络信息采集不仅包括对互联网公共实体信息的查询和存储,还 包括对信息的归类、提取和解析,更重要的是在已收集信息的基础上分析数 据,并将分析结果用于实际问题的解决

网络信息采集的原则 网络信息采集概念 ■全面性原则 ■针对性原则 ■时效性原则 ■选择性原则 ■全程性原则 主讲:郭春燕
主讲:郭春燕 网络信息采集的原则 网络信息采集概念 ◼ 全面性原则 ◼ 针对性原则 ◼ 时效性原则 ◼ 选择性原则 ◼ 全程性原则

网络信息采集的特点 网络信息采集概念 ■采集对象多样化:传统的文献信息资源采集是以纸张为载体的印刷型文献 为主,采集种类单一。而在网络环境下,各种各样名目繁多的电子文献和网 络文献层出不穷,文献信息资源的种类呈现出多样化发展趋势,文献信息资 源的采集种类包括传统的印刷型文献、各类电子文献和各类网上信息资源。 ■采集方式多元化:传统的文献信息资源采集主要是根据需要,通过订单向 出版社或书商订购或直接到书店选书,采集方式比较单一。而在网络环境下 由于信息存储、传输和再现发生了变化,文献信息资源的出版发行渠道变得 更加复杂多样,人们采集文献信息资源的方式除了传统方式外,还包括入网、 联机使用、租用、免费获取等方式,采集方式呈现出多元化的趋势: ■采集手段现代化:传统的文献信息资源采集,主要是以手工操作的方式进 行,程序复杂、烦琐,不但花费大量的时间,而且容易出现差错。网络环境 下的文献信息资源的采集实现了现代化、电子化和网络化,用先进的计算机 技术可以从事查重、打印订单、统计、验收等工作,不仅速度快、效率高, 而且不容易出现差错。 主讲:郭春燕
主讲:郭春燕 网络信息采集的特点 网络信息采集概念 ◼ 采集对象多样化:传统的文献信息资源采集是以纸张为载体的印刷型文献 为主,采集种类单一。而在网络环境下,各种各样名目繁多的电子文献和网 络文献层出不穷,文献信息资源的种类呈现出多样化发展趋势,文献信息资 源的采集种类包括传统的印刷型文献、各类电子文献和各类网上信息资源。 ◼ 采集方式多元化:传统的文献信息资源采集主要是根据需要,通过订单向 出版社或书商订购或直接到书店选书,采集方式比较单一。而在网络环境下, 由于信息存储、传输和再现发生了变化,文献信息资源的出版发行渠道变得 更加复杂多样,人们采集文献信息资源的方式除了传统方式外,还包括入网、 联机使用、租用、免费获取等方式,采集方式呈现出多元化的趋势。 ◼ 采集手段现代化:传统的文献信息资源采集,主要是以手工操作的方式进 行,程序复杂、烦琐,不但花费大量的时间,而且容易出现差错。网络环境 下的文献信息资源的采集实现了现代化、电子化和网络化,用先进的计算机 技术可以从事查重、打印订单、统计、验收等工作,不仅速度快、效率高, 而且不容易出现差错

网络信息采集的衡量标淮 网络信息采集概念 冬内容标准 ■权威性:指信息发布者是学术权威或者是有影响的学术机构,专业性网站 评价机构对它有比较好的评价结果,资源在本领域有一定知名度与学术号召力, 得到本领域相当数量专业学者的公认。 ■实用性:指广告所占比例低,对信息进行了深度揭示,包括与其他外部信息 的链接,对链接列表中的资源有注释说明。 ■准确性:指资源内容基本覆盖资源标题的范畴,内容客观,信息准确可靠, 语法和拼写错误很少甚至是没有,转载的内容有来源说明,链接有效性高。 ■实效性:指资源内容反映学科的最新发展,近期内进行过内容更新且注明了 最后更新日期。 ■独特性:指资源包含信息基本上是其他网络资源不具有的,网站上的内容主 要为原始信息而不是转载或指向其他网站的链接。 ■全面性:指资源内容包含这一领域尽可能全的信息,资源来源渠道多样化
Company Logo www.themegallery.com ◼ 权威性:指信息发布者是学术权威或者是有影响的学术机构,专业性网站 评价机构对它有比较好的评价结果,资源在本领域有一定知名度与学术号召力, 得到本领域相当数量专业学者的公认。 ◼ 实用性:指广告所占比例低,对信息进行了深度揭示,包括与其他外部信息 的链接,对链接列表中的资源有注释说明。 ◼ 准确性:指资源内容基本覆盖资源标题的范畴,内容客观,信息准确可靠, 语法和拼写错误很少甚至是没有,转载的内容有来源说明,链接有效性高。 ◼ 实效性:指资源内容反映学科的最新发展,近期内进行过内容更新且注明了 最后更新日期。 ◼ 独特性:指资源包含信息基本上是其他网络资源不具有的,网站上的内容主 要为原始信息而不是转载或指向其他网站的链接。 ◼ 全面性:指资源内容包含这一领域尽可能全的信息,资源来源渠道多样化。 ❖ 内容标准 网络信息采集的衡量标准 网络信息采集概念

网络信息采集的衡量标准 冬形式标准 形式标准主要从三个方面去衡量,就是资源的组织与利用方式、资源的接入 条件、网站的页面设计。 ■资源的组织与利用方式:包括资源的分类与组织是否科学、合理,浏览导航 结构是否清晰、易用,网站资源是否具有供用户检索的搜索引擎,搜索引擎 是否允许逻辑运算,搜索结果能否按相关度排序等。 ■资源的接入条件:是指资源的接入是否便利,对用户的硬件和软件是否有特 别的要求(比如安装插件或特殊软件),是否有知识产权方面的限制条件,是 否需要注册才能访问,资源接入时反应是否快捷。 ■网站的页面设计:是指用户界面是否友好,页面是否整洁、柔和、协调、美 观,网页各部分的位置关系和所占比例是否合适,是否具有准确的站点导航 图
❖ 形式标准 形式标准主要从三个方面去衡量,就是资源的组织与利用方式、资源的接入 条件、网站的页面设计。 ◼ 资源的组织与利用方式:包括资源的分类与组织是否科学、合理,浏览导航 结构是否清晰、易用,网站资源是否具有供用户检索的搜索引擎,搜索引擎 是否允许逻辑运算,搜索结果能否按相关度排序等。 ◼ 资源的接入条件:是指资源的接入是否便利,对用户的硬件和软件是否有特 别的要求(比如安装插件或特殊软件),是否有知识产权方面的限制条件,是 否需要注册才能访问,资源接入时反应是否快捷。 ◼ 网站的页面设计:是指用户界面是否友好,页面是否整洁、柔和、协调、美 观,网页各部分的位置关系和所占比例是否合适,是否具有准确的站点导航 图。 网络信息采集的衡量标准

网络信息资源采集的途径与策略 网络信息采集概念 网络信息资源采集的途径 网络信息资源采集的策略 主讲:郭春燕
Company Logo www.themegallery.com 主讲:郭春燕 网络信息资源采集的途径 创新性 网络信息资源采集的策略 网络信息资源采集的途径与策略 网络信息采集概念