正在加载图片...
基于RSS的企业Web搜索引擎研究与设计 第一章绪论 原因,是基于P山ll模式信息采集技术自身难以克服的问题之一。 要从根本上解决此问题,就需要采用Push模式采集信息,把一点到多点的 遍历采集方式转变为多点到一点的推送方式,从而达到信息的实时采集,定向定 量采集,降低系统部署和运行成本的效果。 因此,本文提出一种基于Push模式的RSS技术进行信息采集的搜索引擎模 型,同时结合企业应用需求,设计一个实效性强、部署运行成本低、高质量的企 业级Web搜索引擎。 1.4.3论文的组织 以搜索引擎的各组成部分为主线,依次对中文分词、数据索引和数据检索部 分web搜索引擎关键技术的工作原理、工作流程、设计方法等进行了详细的探 讨,同时结合企业搜索引擎的特点对部分技术进行重点研究和改进。然后论文从 总体上给出对基于RSS的企业Web搜索引擎的设计。 第1章概述搜索引擎和企业搜索引擎的国内外发展现状,搜索引擎基本结 构,提出问题和解决问题的思路。 第2章介绍RSS技术,剖析RSS相关技术标准,对RSS不同版本进行比较 研究,论述RSS技术在信息采集上的特点和优势。 第3章论述基于RSS的搜索引擎信息自动采集技术,提出一种基于元搜索 的 RSS Feed自动搜集技术。 第4章对中文自动分词和数据索引相关技术进行研究,结合企业应用的需 求,对分词技术和索引技术进行改进。 第5章概述了常用的数据检索模型,分析各自的优缺点。对检索模型及其实 现方法进行重点阐述。论述增强用户检索效率和质量的方法 第6章用流程图对整体实现过程进行说明,对系统整体进行模块划分,并详 细说明了各子模块的功能。介绍实现中用到的主要数据结构并给出了部分测试结 果 第7章总结全文,指出本文设计中的不足之处并对后续的研究工作提出了展 第6页共47页基于 RSS 的企业 Web 搜索引擎研究与设计 第一章 绪 论 第 6 页 共 47 页 原因,是基于 Pull 模式信息采集技术自身难以克服的问题之一。 要从根本上解决此问题,就需要采用 Push 模式采集信息,把一点到多点的 遍历采集方式转变为多点到一点的推送方式,从而达到信息的实时采集,定向定 量采集,降低系统部署和运行成本的效果。 因此,本文提出一种基于 Push 模式的 RSS 技术进行信息采集的搜索引擎模 型,同时结合企业应用需求,设计一个实效性强、部署运行成本低、高质量的企 业级 Web 搜索引擎。 1.4.3 论文的组织 以搜索引擎的各组成部分为主线,依次对中文分词、数据索引和数据检索部 分 Web 搜索引擎关键技术的工作原理、工作流程、设计方法等进行了详细的探 讨,同时结合企业搜索引擎的特点对部分技术进行重点研究和改进。然后论文从 总体上给出对基于 RSS 的企业 Web 搜索引擎的设计。 第 1 章概述搜索引擎和企业搜索引擎的国内外发展现状,搜索引擎基本结 构,提出问题和解决问题的思路。 第 2 章介绍 RSS 技术,剖析 RSS 相关技术标准,对 RSS 不同版本进行比较 研究,论述 RSS 技术在信息采集上的特点和优势。 第 3 章论述基于 RSS 的搜索引擎信息自动采集技术,提出一种基于元搜索 的 RSS Feed 自动搜集技术。 第 4 章对中文自动分词和数据索引相关技术进行研究,结合企业应用的需 求,对分词技术和索引技术进行改进。 第 5 章概述了常用的数据检索模型,分析各自的优缺点。对检索模型及其实 现方法进行重点阐述。论述增强用户检索效率和质量的方法。 第 6 章用流程图对整体实现过程进行说明,对系统整体进行模块划分,并详 细说明了各子模块的功能。介绍实现中用到的主要数据结构并给出了部分测试结 果。 第 7 章总结全文,指出本文设计中的不足之处并对后续的研究工作提出了展 望
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有