正在加载图片...
Web检 相关网站 元数据提取 —建立 索引 本地数据库 相关论坛 图 4.系统用例图 系统 WebCrawler)取 搜索得结果 Search 信息提纯 用户 Internet 含试索引 本地数据库 图2 5.系统性能要求 1)响应时间 系统的响应速度应该在用户可接受的范围之内,至少与现有各种搜索引擎相当。这点要 求我们必须建立结构合理的索引以及设计高效准确的查询、搜索算法。 2)结果的准确性和合理性 对于用户输入的搜索条件,返回的结果应该尽可能的和他期望的保持一致,并且越接近 的余越应先被用户看到。这涉及到网页信息提取、索引建立、条件匹配、结果排序等问题 3)时效性 用户希望看到的是越新的信息越好,过时的租房信息对于用户来说没有价值或者只有很 小的参考价值。这要求我们尽可能频繁的对网站进行抓取,然后分析,另一方面,在将结果 呈现给用户的时候,排序也要考虑到时间因素,即越新的信息要越排在前面 4)灵活性 系统要有良好的接口,便于后面的扩充,以适应信息源的增加或者减少:要留有服务器 接口,以实现后面服务器功能的需要;要具有跨平台功能。 5)其它本地 检索 模块 本地数据库 用户 界面 元数据提取 模块 WebCrawler Web检 相关网站 索模块 相关论坛 分词 建立 索引 图 1 4. 系统用例图 图 2 5. 系统性能要求 1) 响应时间 系统的响应速度应该在用户可接受的范围之内,至少与现有各种搜索引擎相当。这点要 求我们必须建立结构合理的索引以及设计高效准确的查询、搜索算法。 2) 结果的准确性和合理性 对于用户输入的搜索条件,返回的结果应该尽可能的和他期望的保持一致,并且越接近 的余越应先被用户看到。这涉及到网页信息提取、索引建立、条件匹配、结果排序等问题。 3) 时效性 用户希望看到的是越新的信息越好,过时的租房信息对于用户来说没有价值或者只有很 小的参考价值。这要求我们尽可能频繁的对网站进行抓取,然后分析,另一方面,在将结果 呈现给用户的时候,排序也要考虑到时间因素,即越新的信息要越排在前面。 4) 灵活性 系统要有良好的接口,便于后面的扩充,以适应信息源的增加或者减少;要留有服务器 接口,以实现后面服务器功能的需要;要具有跨平台功能。 5) 其它
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有