网络信息检索 余晓蔚 xwyu@lib.sjtu.edu.cn
网络信息检索 余晓蔚 xwyu@lib.sjtu.edu.cn
大纲 。网络信息服务 0 搜索引擎概述 。常用搜索引擎 0检索技巧 0特色搜索网站 o插件工具
大纲 ¡ 网络信息服务 ¡ 搜索引擎概述 ¡ 常用搜索引擎 ¡ 检索技巧 ¡ 特色搜索网站 ¡ 插件工具
网络信息服务 o电子邮件服务(E-mail) o远程登录服务(Telnet) o文件传输服务(FTP) o新闻组(Usenet)、讨论组(Listserv) 和用户组(Mailing List) ·网络信息交流的工具
网络信息服务 ¡ 电子邮件服务(E-mail) ¡ 远程登录服务(Telnet) ¡ 文件传输服务(FTP) ¡ 新闻组(Usenet)、讨论组(Listserv) 和用户组(Mailing List) l 网络信息交流的工具
网络信息服务 网络用户可以就自己感兴趣或关心的问题,随 时与其它人互通信息或进行讨论,而超越时空 的限制 0 议题包罗万象,每个议题都是一个网络兴趣小 组,小组的成员即为用户。 在网络信息的存储方面,新闻组的信息存储在 一定的网络主机上,用户到时各取所需,只需 合适的阅读软件就可使用,无需输入订阅手续 讨论组和用户组则不然,尽管它们不收费,但 仍要求每个用户履行一定的订阅手续,有关信 息均直接“寄送”到各用户的电子信箱中
网络信息服务 l 网络用户可以就自己感兴趣或关心的问题,随 时与其它人互通信息或进行讨论,而超越时空 的限制 l 议题包罗万象,每个议题都是一个网络兴趣小 组,小组的成员即为用户。 l 在网络信息的存储方面,新闻组的信息存储在 一定的网络主机上,用户到时各取所需,只需 合适的阅读软件就可使用,无需输入订阅手续 l 讨论组和用户组则不然,尽管它们不收费,但 仍要求每个用户履行一定的订阅手续,有关信 息均直接“寄送”到各用户的电子信箱中
新闻组的优点 0海量信息 。直接交互性 0全球互联性 0主题鲜明
新闻组的优点 ¡ 海量信息 ¡ 直接交互性 ¡ 全球互联性 ¡ 主题鲜明
新闻组的命名规则 cop:,关于计算机专业及业余爱好者的主题。包括计算机 科学、软件资源、硬件资源和软件信息等。 sc:,关于科学研究、应用或相关的主题,一般情况下不包括 计算机。 SoC:关于社会科学的主题。 0 tak:一些辩论或人们长期争论的主题。 0 news:关于新闻组本身的主题,如新闻网络、新闻组维护 等。 rec: 关于休闲、娱乐的主题。 at:比较杂乱,无规定的主题,任何言论在这里都可以发表。 obz:关于商业或与之相关的主题。 0 isc:其余的主题。在新闻组里,所有无法明确分类的东西 都称之为misc
新闻组的命名规则 ¡ comp:关于计算机专业及业余爱好者的主题。包括计算机 科学、软件资源、硬件资源和软件信息等。 ¡ sci:关于科学研究、应用或相关的主题,一般情况下不包括 计算机。 ¡ soc:关于社会科学的主题。 ¡ talk:一些辩论或人们长期争论的主题。 ¡ news:关于新闻组本身的主题,如新闻网络、新闻组维护 等。 ¡ rec:关于休闲、娱乐的主题。 ¡ alt:比较杂乱,无规定的主题,任何言论在这里都可以发表。 ¡ biz:关于商业或与之相关的主题。 ¡ misc:其余的主题。在新闻组里,所有无法明确分类的东西 都称之为misc
网络信息检索 o文档查询(Archie) 0 基于菜单的信息检索(Gopher) o基于关键词的文档检索(WAIS) o基于超文本的搜索引擎(Search Engine)
网络信息检索 ¡ 文档查询(Archie) ¡ 基于菜单的信息检索(Gopher) ¡ 基于关键词的文档检索(WAIS) ¡ 基于超文本的搜索引擎(Search Engine)
搜索引擎概述 0什么是搜索引擎 搜索引擎是一个为你提供信息检索服务的网站, 它使用某些程序把因特网上的所有信息归类以 帮助人们在茫茫网海中搜寻到所需要的信息 是Internet.上具有查询功能的网页的统称,是 开启网络知识殿堂的钥匙,获取知识信息的工 具 优点:信息量大;信息更新速度快;方 便普通用户使用 o缺陷:信息噪音较大
搜索引擎概述 ¡ 什么是搜索引擎 l 搜索引擎是一个为你提供信息检索服务的网站, 它使用某些程序把因特网上的所有信息归类以 帮助人们在茫茫网海中搜寻到所需要的信息 l 是Internet上具有查询功能的网页的统称,是 开启网络知识殿堂的钥匙,获取知识信息的工 具 ¡ 优点 :信息量大;信息更新速度快;方 便普通用户使用 ¡ 缺陷:信息噪音较大
搜索引擎概述 o搜索引擎的组成和运作 。搜索器(Searcher)一数据采集 o定期或不定期地搜索Internet各个站点,并将收 集到的网络信息资源送回搜索引擎的临时数据库 。索引器(Indexer)一数据组织 。利用索引软件对这些收集到的信息进行自动标引 形成规范的索引,加入集中管理的索引数据库 ·用户检索界面(Interface)一用户检索 o在Web的客户端,提供特定的检索界面,供用户 以一定的方式输入检索提问式并提交给系统,系 统通过特定的检索软件检索其索引数据库,并将 从中获得的与用户检索提问相匹配的查询结果再 返回客户端供用户浏览
搜索引擎概述 ¡ 搜索引擎的组成和运作 l 搜索器(Searcher)—数据采集 ¡ 定期或不定期地搜索Internet各个站点,并将收 集到的网络信息资源送回搜索引擎的临时数据库 l 索引器(Indexer)—数据组织 ¡ 利用索引软件对这些收集到的信息进行自动标引 形成规范的索引,加入集中管理的索引数据库 l 用户检索界面(Interface)—用户检索 ¡ 在Web的客户端,提供特定的检索界面,供用户 以一定的方式输入检索提问式并提交给系统,系 统通过特定的检索软件检索其索引数据库,并将 从中获得的与用户检索提问相匹配的查询结果再 返回客户端供用户浏览
搜索引擎概述 。搜索引擎功能简介 。简单搜索(Simple Search):指输入一个单 词(关键词),提交搜索引擎查询,这是最基本 的搜索方式 词组搜索(Phrase Search):指输入两个单词 以上的词组(短语),提交搜索引擎查询,也叫 短语搜索,现有搜索引擎一般都约定把词组或 短语放在引号“”内表示
搜索引擎概述 ¡ 搜索引擎功能简介 l 简单搜索(Simple Search):指输入一个单 词(关键词),提交搜索引擎查询,这是最基本 的搜索方式 l 词组搜索(Phrase Search):指输入两个单词 以上的词组(短语),提交搜索引擎查询,也叫 短语搜索,现有搜索引擎一般都约定把词组或 短语放在引号“”内表示