第二章 网络信息采集技术介绍 一、重难点分析: 拿掘:(络信息货源采集的质量标准、途径与策略,络检素自动化技术的发展,常用网络信 息采集软件的使用方法。 理解:网络信息采集的特点,原则,网络检索多媒体技术的应用及检素工具的智能化发展。 了解:网路信息采集系统的应用前景,常用网络信息采集软件的种类。 本章学习的重点是网路信息采集软件的使川方法。学习者应对网格信息果集系统的基本技术及 应用前景有一个基本的了解,然委儿种常用的网络信息采集款件,能够熟练草摆其中一种信息采集 软件的使用方法,能够利用信息采集技术收集到自己所需要的信息。 本章的教学难点是网格信息采从技术的发展。 其中重点知识包括 一、网路信息采集是指从互联网共享服务贤源中收集、处理和分析网路实体信息的过程, 网络信息采集执行的果集标准: 全而性原则 针对性原则 时效性原则 选择性原则 全程性原则 二、网格信息资源采集的特点主要表现为采集对象的多样化、采集方式的多元化以及采集手段 的现代化。 三,网铬信息采集的质量标准: 1、内容标准 2、形式标准 四、网路信息资源采集的途径 1、人工采集 2、采集器白动抓取 3、定制信息 五、网路信息检索技术 1、,资源定位检素技术 2、“超链接”搜索技术 3、网洛搜索引擎技术 4,WEB挖据技术 入、网格信息采集载件简介
- 1 - 第二章 网络信息采集技术介绍 一、重难点分析: 掌握:网络信息资源采集的质量标准、途径与策略,网络检索自动化技术的发展,常用网络信 息采集软件的使用方法。 理解:网络信息采集的特点、原则,网络检索多媒体技术的应用及检索工具的智能化发展。 了解:网络信息采集系统的应用前景,常用网络信息采集软件的种类。 本章学习的重点是网络信息采集软件的使用方法。学习者应对网络信息采集系统的基本技术及 应用前景有一个基本的了解,熟悉几种常用的网络信息采集软件,能够熟练掌握其中一种信息采集 软件的使用方法,能够利用信息采集技术收集到自己所需要的信息。 本章的教学难点是网络信息采从技术的发展。 其中重点知识包括: 一、网络信息采集是指从互联网共享服务资源中收集、处理和分析网络实体信息的过程。 网络信息采集执行的采集标准: 全面性原则 针对性原则 时效性原则 选择性原则 全程性原则 二、网络信息资源采集的特点主要表现为采集对象的多样化、采集方式的多元化以及采集手段 的现代化。 三、网络信息采集的质量标准: 1、内容标准 2、形式标准 四、网络信息资源采集的途径 1、人工采集 2、采集器自动抓取 3、定制信息 五、网络信息检索技术 1、资源定位检索技术 2、“超链接”搜索技术 3、网络搜索引擎技术 4、WEB 挖掘技术 六、网络信息采集软件简介
目前常用的网路信息采集软件主要有:网路信息采集专家、网站万能情息采集器以及网格信息 采集大师等。 实例讲解网铬信息采集大师(NetGet)的使用 二、典型例题 I.使用网路信息采集大师(N4G)输出数据时,下列格式中,()是不能导出 的。 A.文本文件 B.Excel文件C,数据库文件 D.网页文相 2,指示信息、信息单元、文献、信息资源等是按( )方式划分出的网络信息货源。 A.信息存取方式 B.信息的加工层次 C,网路信息资源的层次 D.信息的载体形式 3.下列不属于网路信息紧集的选择性原则的是()。 A。信息来源有选择B,采集方法有选择 C.保证质量的情况下兼顺数量D.定期采集最新信息 4,严格的资源采集标准是保证信息资源可靠性的关键之一。其中,要求广告所占比例 低,对信息进行深度揭示的是()标准 A。时效性 B,深刻性 C,实用性 D.独特性 5,网络信息资源采集的形式标准不包含下列愿项?() A。资源的组织及利用方式 B。资源内容覆盖面大小 C,货源的接入条作 D.网站的页面设计 在你对网络信息资源有了一定认识的基础上,请思考如下问愿,把所学的知凯再梳理和明确一 下 1、流一下网修信息资激采集的质量标准有哪些 2、你知道网络信息资源采集的途径和策略有哪些吗? 3、分析一下网络检案技术的发展趋势吧: 参考答案:1、D2.C3、D4、C5、B 思考题:略,参见教材第二章内容。 -2
- 2 - 目前常用的网络信息采集软件主要有:网络信息采集专家、网站万能信息采集器以及网络信息 采集大师等。 实例讲解网络信息采集大师(NetGet)的使用 二、典型例题 1.使用网络信息采集大师(NetGet)输出数据时,下列格式中,( )是不能导出 的。 A.文本文件 B.Excel 文件 C.数据库文件 D.网页文件 2.指示信息、信息单元、文献、信息资源等是按( )方式划分出的网络信息资源。 A.信息存取方式 B.信息的加工层次 C.网络信息资源的层次 D.信息的载体形式 3.下列不属于网络信息采集的选择性原则的是( )。 A.信息来源有选择 B.采集方法有选择 C.保证质量的情况下兼顾数量 D.定期采集最新信息 4.严格的资源采集标准是保证信息资源可靠性的关键之一。其中,要求广告所占比例 低,对信息进行深度揭示的是( )标准。 A.时效性 B.深刻性 C.实用性 D.独特性 5.网络信息资源采集的形式标准不包含下列哪项?( ) A.资源的组织及利用方式 B.资源内容覆盖面大小 C.资源的接入条件 D.网站的页面设计 在你对网络信息资源有了一定认识的基础上,请思考如下问题,把所学的知识再梳理和明确一 下。 1、 谈一下网络信息资源采集的质量标准有哪些? 2、 你知道网络信息资源采集的途径和策略有哪些吗? 3、 分析一下网络检索技术的发展趋势吧。 参考答案: 1、D 2、C 3、D 4、C 5、 B 思考题:略,参见教材第二章内容