网络信息检索 第三章 上海理工大学电子商务研究所
上海理工大学电子商务研究所 设计制作:王锡俊 网络信息检索 第 三 章
第三章网络信息处理技术 31信息网络的技术特征 3.2网络信息获取技术 3.3网络信息推送技术 3.4数据挖掘技术
第三章 网络信息处理技术 3.1 信息网络的技术特征 3.2 网络信息获取技术 3.3 网络信息推送技术 3.4 数据挖掘技术
3.1信息网络的技术特征 3.1.1网络的技术构成 31.2网络信息文化是多种技术的汇集 31.3信息在网络中的运作方式
3.1 信息网络的技术特征 3.1.1 网络的技术构成 3.1.2 网络信息文化是多种技术的汇集 3.1.3 信息在网络中的运作方式
3.1.1网络的技术构成 计算机网络技术是通信技术与计算机技术、微电子技术 光通信技术等相结合的信息技术,它包含计算机网络中 的语言、计算机网络体系结构等几个方面。 1.计算机网络中的语 通信是在人们之间传递消息,一次通信要3个因素:通信 双方有通信的愿望和要求;通信双方之间有通信的信道 通信双方遵循彼此认可的通信规则,即通信协议或网络 协议。 网络协议作为计算机之间通信的规范也有3个要素:语法, 即信息格式;语义,某些信息组合的含义;同步,即收 发双方能分辨出通信的开始和结束
3.1.1 网络的技术构成 ◼ 计算机网络技术是通信技术与计算机技术、微电子技术、 光通信技术等相结合的信息技术,它包含计算机网络中 的语言、计算机网络体系结构等几个方面。 1. 计算机网络中的语言 ◼ 通信是在人们之间传递消息,一次通信要3个因素:通信 双方有通信的愿望和要求;通信双方之间有通信的信道; 通信双方遵循彼此认可的通信规则,即通信协议或网络 协议。 ◼ 网络协议作为计算机之间通信的规范也有3个要素:语法, 即信息格式;语义,某些信息组合的含义;同步,即收、 发双方能分辨出通信的开始和结束
2.计算机网络体系结构 个复杂的系统往往划分为若干个层次,每个层次独立 地实现相应的功能,层与层之间有接口衔接,通过接口 传递参数,下层为上层提供服务,从而完成复杂的功能, 通信系统也不例外。以两个人之间的自然语言通信为例, 可以认为分为3个层次 )传输层。2)语言层。3)知识层。 口网络体系结构采用层次结构,TCP/P网络体系结构就是 层次结构,分为4个层次,网络接口层( Network Interface Layer)、网络层( Internet Layer)、传输层 (Transport Layer 和应用层( Application Layer) 网络接口层用于控制对本地局域网或广域网的访问;网 络层负责解决一台计算机通过网络到另一台计算机的通 信问题;传输层负责端到端的通信;应用层包括若干网 络应用程序
2. 计算机网络体系结构 ◼ 一个复杂的系统往往划分为若干个层次,每个层次独立 地实现相应的功能,层与层之间有接口衔接,通过接口 传递参数,下层为上层提供服务,从而完成复杂的功能, 通信系统也不例外。以两个人之间的自然语言通信为例, 可以认为分为3个层次: 1)传输层。 2)语言层。 3)知识层。 ◼ 网络体系结构采用层次结构,TCP/IP网络体系结构就是 层次结构,分为4个层次,网络接口层(Network Interface Layer)、网络层(Internet Layer)、传输层 (Transport Layer)和应用层(Application Layer)。 ◼ 网络接口层用于控制对本地局域网或广域网的访问;网 络层负责解决一台计算机通过网络到另一台计算机的通 信问题;传输层负责端到端的通信;应用层包括若干网 络应用程序
3.本书涉及到的计算机网络术语 1)IS( Internet Information Server):互联网信息服务 2)ISP( Internet service provider):互联网服务供应商 3)RFC( Request File comment):征求意见稿(评注) 4)IAB( Internet Activities board): Internet工作委员会 5)(I( Global Information Interconnection):全球信息互 连网络 6)电子邮件(E-mai):通过计算机网络发送和接收电子邮 件 7)页面(page)和主页( homepage):www是由庞大的、 世界范围的文档集合组成,这些文档简称为页面 8)NI( National Information Infrastructure):国家信息 ∠基础设施
3. 本书涉及到的计算机网络术语 1) IIS (Internet Information Server):互联网信息服务 2) ISP(Internet Service Provider):互联网服务供应商 3) RFC(Request File Comment):征求意见稿(评注) 4) IAB (Internet Activities Board):Internet 工作委员会 5) GII(Global Information Interconnection):全球信息互 连网络 6) 电子邮件(E-mail):通过计算机网络发送和接收电子邮 件 7) 页面(page)和主页(homepage):WWW是由庞大的、 世界范围的文档集合组成,这些文档简称为页面 8) NII(National Information Infrastructure):国家信息 基础设施
3.1.2网络信息文化是多种技术的汇集 计算机网络信息文化的实质是计算机技术、数据通信技 术和信息处理技术这3种技术的汇合。计算机技术包括硬 件、软件、大容量存储设备、各种输入输出设备,以及 相应的服务;数据通信技术包括电话、电视、传输电缆、 光缆、通信传输、通信处理、通信卫星和无线通信等; 信息处理技术包括教育、娱乐、出版、信息提供、信息 组织和存储、信息检索等。这些技术形成了信息社会的3 个行业,总产值的比例分别为计算机技术占44%,通信 技术占28%,信息处理占28%
3.1.2 网络信息文化是多种技术的汇集 ◼ 计算机网络信息文化的实质是计算机技术、数据通信技 术和信息处理技术这3种技术的汇合。计算机技术包括硬 件、软件、大容量存储设备、各种输入输出设备,以及 相应的服务;数据通信技术包括电话、电视、传输电缆、 光缆、通信传输、通信处理、通信卫星和无线通信等; 信息处理技术包括教育、娱乐、出版、信息提供、信息 组织和存储、信息检索等。这些技术形成了信息社会的3 个行业,总产值的比例分别为计算机技术占44%,通信 技术占28%,信息处理占28%
313信息在网络中的运作方式 要完成信息的传送,最常用的办法是把信息先附加(调 制)在一个电磁波(载波)上,然后把被调制的载波送 (传播)到目的地,在目的地接到电磁波后,再把信息 复原(解调)。这种系统通常由无线电通信和光波频段 通信组成(图3-1)。 接受器 发送器 终端 计算机 发送器 接受器 图3-1信息传输流程
3.1.3 信息在网络中的运作方式 ◼ 要完成信息的传送,最常用的办法是把信息先附加(调 制)在一个电磁波(载波)上,然后把被调制的载波送 (传播)到目的地,在目的地接到电磁波后,再把信息 复原(解调)。这种系统通常由无线电通信和光波频段 通信组成(图3-1)。 计算机 接受器 发送器 发送器 接受器 终端 图3-1 信息传输流程
32网络信息获取技术 32.1互联网的接入方式 3.2.2|P地址和域名系统 32.3统一资源定位符URL 32.4超文本、超链接和超媒体 3.2.5超文本传输协议HTP和 超文本标记语言HTML
3.2 网络信息获取技术 3.2.1 互联网的接入方式 3.2.2 IP地址和域名系统 3.2.3 统一资源定位符URL 3.2.4 超文本、超链接和超媒体 3.2.5 超文本传输协议HTTP和 超文本标记语 言HTML
321互联网的接入方式 通过局域网直接连接,局域网的服务器是互联网中的一 个主机,有独立的地址,用户的计算机连接到局域网 通过电话拨号方式直接连接,用户的计算机利用点到点 协议(PPP协议)和串行接口协议SLP,通过 Modem连 接电话线到互联网的主机。 通过电话拨号间接连接,进入一个提供互联网服务的联 机服务系统 前两种方法是直接连接,用户运行TCP/IP协议,在互联 网上具有和其他互联网用户同样的地位。第三种方法是 间接连接,连接服务系统直接连接到互联网上,用户终 端仿真软件访问有联机服务系统提供的服务
3.2.1 互联网的接入方式 ◼ 通过局域网直接连接,局域网的服务器是互联网中的一 个主机,有独立的IP地址,用户的计算机连接到局域网 上。 ◼ 通过电话拨号方式直接连接,用户的计算机利用点到点 协议(PPP协议)和串行接口协议SLIP,通过Modem连 接电话线到互联网的主机。 ◼ 通过电话拨号间接连接,进入一个提供互联网服务的联 机服务系统。 ◼ 前两种方法是直接连接,用户运行TCP/IP协议,在互联 网上具有和其他互联网用户同样的地位。第三种方法是 间接连接,连接服务系统直接连接到互联网上,用户终 端仿真软件访问有联机服务系统提供的服务