第五章互联网学术信息检索 第二节搜索引擎
第五章 互联网学术信息检索 第二节 搜索引擎
搜索引擎概述 通用搜索引擎 学术资源搜索引擎 四、其他搜索引擎
一、搜索引擎概述 二、通用搜索引擎 三、学术资源搜索引擎 四、其他搜索引擎
搜索引擎概述 )搜索引擎的概念 检索因特网信息最常用的检索工具,它是提 供万维网上信息资源检索和导航服务的专门站点 或服务器 二)搜索引擎的种类 ■独立搜索引擎 元搜索引擎
一、搜索引擎概述 (一)搜索引擎的概念 检索因特网信息最常用的检索工具,它是提 供万维网上信息资源检索和导航服务的专门站点 或服务器。 (二)搜索引擎的种类 ◼ 独立搜索引擎 ◼ 元搜索引擎
(二)搜索引擎的种类 ■独立搜索引擎 ■通过搜集万维网的网页信息,建立自己独立的 网络信息数据库供用户检索。 如: Google、 Yahoo!、百度、搜狐等 ■元搜索引擎 ■又称集成搜索引擎,自身不采集信息,没有自 建的数据库。它将用户搜索请求预处理后,提 交给多个选定的独立搜索引擎同时检索,并对 返回结果进行整合,以统一的格式输出 如: Clusty、 Ixquick、Mama、 MetaCrawler等
(二)搜索引擎的种类 ◼ 独立搜索引擎 ◼ 通过搜集万维网的网页信息,建立自己独立的 网络信息数据库供用户检索。 如: Google、Yahoo!、百度、搜狐等 ◼ 元搜索引擎 ◼ 又称集成搜索引擎,自身不采集信息,没有自 建的数据库。它将用户搜索请求预处理后,提 交给多个选定的独立搜索引擎同时检索,并对 返回结果进行整合,以统一的格式输出。 如:Clusty、Ixquick、Mama、MetaCrawler等
通用搜索引擎 Google(www.g.cn) OpenDirectoryPoject(http://www.dmoz.org) ■目录查询与网页检索途径比较
二、通用搜索引擎 ◼ Google(www.g.cn) ◼ Open Directory Poject(http://www.dmoz.org) ◼ 目录查询与网页检索途径比较
(-)google(www.googLE.com.hk) 经常光顾此页?请将 Google设为意的主页。好的不用了 +你搜索图片地图 Play YouTube新闻Gmal更多 登录 Google 谷歌 le搜 汽不链 探索发现艺术佳作,自建珍藏集欣贳并分享 Google. com. hk使用下列语言:中文(繁體) English 加入营销计划隐私权和使用条款 Google大全 com 气100%
(一)Google(www.google.com.hk)
Google的搜索模块 搜索服务 探索与创新 文章中查找您感兴趣的主题 器 、产品模型和试验的演练场 学搜索 待定大学的网站 分享与沟通 ” 地址、索周边和规划路线 查看、翻译其他语言的网页 ⊙您的浏览器配置搜索框,随时600-下 回 建立日程、管理活动,和他人分享行程 实时新闻,直接发至邮箱 我3理件机上所有片和图 视频 搜索网络视频 线建立、撰写、储存和分享您的文档与电子表格 移动服务 几十亿张图片 移动服务 图书搜索 从手机使用各项 Google服务 搜索图书全文,并发现新书 网页目录 其他语言的产品 安分类主题浏览互联网 除非特别注明,以下产品目前均为英文版 网页搜索 叟索全球上百亿网页资料库 下载AP应用程序编程接口及开放源代码 ③ 网页搜索 于算器、股票查询、英汉互译等搜索小窍门 吴得禮文查 x燾撵 9图件,在电盾上进行建资设计
Google的搜索模块
Google的检索规则 Google简单检索规则: ■默认检索:必须检索,两词间空格默认and匹配 ■必须检索:“+”表示,加号前须留空格,加号 后不空格,则检出网页必定会含有该检索词 或者检索:OR必须大写 排除检索:-表示,减号之前须空格,其后不空 格(不能用NOT) ■短语检索:双引号扩起词组或短语 ■对大小写不敏感 ■截词符:* ■自动拼写检查
Google的检索规则 ◼ Google简单检索规则: ◼ 默认检索:必须检索,两词间空格默认and匹配 ◼ 必须检索:“+”表示,加号前须留空格,加号 后不空格,则检出网页必定会含有该检索词。 ◼ 或者检索:OR必须大写 ◼ 排除检索:-表示,减号之前须空格,其后不空 格(不能用NOT) ◼ 短语检索:双引号扩起词组或短语 ◼ 对大小写不敏感 ◼ 截词符:* ◼ 自动拼写检查
Google的检索规则 ■ Google简单检索规则 检索词出现位置限定: 标题: allintitle网址: allinurl内文: allintext链接: allinanchor 例: allinurl:acm搜索网址内含单词acm的网页 文件类型限定: filetype:文件名后缀 支持13种非 HTML文件搜索:pdf,doe,pt,xs,swf,ps等 禁用词( Stop Words): 最常用的字符以及数字等高频词(of,is,的,为,htp等) 在检索时系统自动忽略不作检索。如果必须检索禁用词 时可用+,或
◼ Google简单检索规则: ◼ 检索词出现位置限定: 标题:allintitle 网址:allinurl 内文:allintext 链接: allinanchor 例:allinurl:acm搜索网址内含单词acm的网页 ◼ 文件类型限定:filetype:文件名后缀 支持13种非HTML文件搜索:pdf, doc, ppt, xls, swf, ps等 ◼ 禁用词(Stop Words): 最常用的字符以及数字等高频词( of, is,的,为, http等), 在检索时系统自动忽略不作检索。如果必须检索禁用词 时可用+,或“ ” Google的检索规则
Google的检索规则 Google高级搜索: +你索图片地图 Play YouTube新闯Gmal更多 高级搜索 使用以下条件来搜索网 在搜索中执行以下握作 页 以下所有字词 敏入要字词:号山鸭架 与以下字词完全匹配 用引号将带要完全匹配的字调引起:“架 以下任意字词: 在所将字词之间添加0:批发0B特价 不含以下任意字词: 在不将要的字词前添加一个减号:一山大,一”叫架 数字范国:从 在数字之间加上两个句号并添加度量单 后按以下标准缩小搜 索结果范围 任何语言 查找使用宏所选语言的网贝 任何国都区 查 最后更新时间 任何时 查线在指定时间内更新的网页 网站或域名 rg或-geu 词出现位置 网页上任何位置 在个网页,两标、两址或指向您所查网页的链接中控
Google的检索规则 ◼ Gooogle高级搜索 :