正在加载图片...
租房信息专业搜索引擊项目计划书 Group Member:骆雄武陈长城杨治国陆腾飞 项目开发背景 衣食住行一直是社会人赖以生存和生活的几大要素。随着当今社会快速的现代化和城市 化,衣、食、行等方面的问题已经变得十分的容易和便捷,但是,住的问题却犹如一座大山, 压在我们的肩头,让我们感觉越来越沉重 在一个现代化的城市中,除去原住民,除去富裕得足以买得起一座房子的和能够幸运的 得到公司或者单位分房的人,其余的相当大的一部分人基本上要靠租房来解决住的问题。但 是,实际中关于住房出租的信息,稀少而且混乱,对于一个急切想要租到一套适合自己需求 的住房的人来说,这显然是十分困难和不便的 有租房需求的主要是这样一些群体:刚刚开始工作的尚无多少积蓄的工薪阶层;已工作 多年但是仍无力购买任何形式住房的低收入阶层:准备考研或其它各种考试的部分大学生群 体:相当一部分的研究生群体。这些人占据了城市生活的相当重要的一角。另一方面,随着 信息技术的飞速发展,人们早已习惯于在网上找寻自己需要的信息,尤其是通过搜索引擎来 从海量的信息中提取自己关注的部分。结合上面两部分因素,我们便自然的产生了开发这样 个租房信息的专业搜索引擎的想法,主要是为了服务于相当一部分的有租房需求的人群。 二、项目需求分析 1.系统目标 本系统的目标就是:为所有需要获取租房信息的人,提供最全面的信息,最便捷的方式 使得网络搜索引擎真正成为最值得信赖的信息来源。这里的租房信息可以包括网络上现有的 所有比较可靠的网站和论坛上发布的信息,也包括和本搜索引擎具有合作关系的房产中介所 提供的信息。这些信息原本散布于各个网站的边角或者张贴于大街小巷的隐蔽位置,本系统 正是需要有效的整合这些渠道的各种信息,最大可能的提供最有价值的租房信息 本系统的提出主要针对传统租房信息获取渠道的不便捷性,即:需要耗费大量的精力 和物力来获取信息,以及现有网络租房信息获取渠道的不完备性,即:信息的非有效性整合 和信息的分布不一致性。同时,本系统又吸收先有信息渠道的长处,做以扩展 2.系统功能 1)信息的抓取 从我们关注的可能会发布租房信息的网站和论坛抓取它们的网页,并以一定格式提取抓 下来的网页中的有效信息 2)信息的处理和存放 对于提取来的文本信息,进行切分分词、添加标签、词频统计,并据此建立全文索引。 3)信息的检索 接收用户输入的搜索条件,对其进行分析处理,然后在索引中进行查询匹配,从本地数 据库中提取所有符合条件的信息 4)返回结果给用户 将提取的信息排序后,以结果页面的形式呈现给用户。 3.系统结构模块 系统总体框架如下图所示租房信息专业搜索引擎项目计划书 Group Name: alpaca Group Member: 骆雄武 陈长城 杨治国 陆腾飞 一、 项目开发背景 衣食住行一直是社会人赖以生存和生活的几大要素。随着当今社会快速的现代化和城市 化,衣、食、行等方面的问题已经变得十分的容易和便捷,但是,住的问题却犹如一座大山, 压在我们的肩头,让我们感觉越来越沉重。 在一个现代化的城市中,除去原住民,除去富裕得足以买得起一座房子的和能够幸运的 得到公司或者单位分房的人,其余的相当大的一部分人基本上要靠租房来解决住的问题。但 是,实际中关于住房出租的信息,稀少而且混乱,对于一个急切想要租到一套适合自己需求 的住房的人来说,这显然是十分困难和不便的。 有租房需求的主要是这样一些群体:刚刚开始工作的尚无多少积蓄的工薪阶层;已工作 多年但是仍无力购买任何形式住房的低收入阶层;准备考研或其它各种考试的部分大学生群 体;相当一部分的研究生群体。这些人占据了城市生活的相当重要的一角。另一方面,随着 信息技术的飞速发展,人们早已习惯于在网上找寻自己需要的信息,尤其是通过搜索引擎来 从海量的信息中提取自己关注的部分。结合上面两部分因素,我们便自然的产生了开发这样 一个租房信息的专业搜索引擎的想法,主要是为了服务于相当一部分的有租房需求的人群。 二、 项目需求分析 1. 系统目标 本系统的目标就是:为所有需要获取租房信息的人,提供最全面的信息,最便捷的方式, 使得网络搜索引擎真正成为最值得信赖的信息来源。这里的租房信息可以包括网络上现有的 所有比较可靠的网站和论坛上发布的信息,也包括和本搜索引擎具有合作关系的房产中介所 提供的信息。这些信息原本散布于各个网站的边角或者张贴于大街小巷的隐蔽位置,本系统 正是需要有效的整合这些渠道的各种信息,最大可能的提供最有价值的租房信息。 本系统的提出主要针对传统租房信息获取渠道的不便捷性,即 :需要耗费大量的精力 和物力来获取信息,以及现有网络租房信息获取渠道的不完备性,即:信息的非有效性整合 和信息的分布不一致性。同时,本系统又吸收先有信息渠道的长处,做以扩展。 2. 系统功能 1) 信息的抓取 从我们关注的可能会发布租房信息的网站和论坛抓取它们的网页,并以一定格式提取抓 下来的网页中的有效信息。 2) 信息的处理和存放 对于提取来的文本信息,进行切分分词、添加标签、词频统计,并据此建立全文索引。 3) 信息的检索 接收用户输入的搜索条件,对其进行分析处理,然后在索引中进行查询匹配,从本地数 据库中提取所有符合条件的信息。 4) 返回结果给用户 将提取的信息排序后,以结果页面的形式呈现给用户。 3. 系统结构模块 系统总体框架如下图所示:
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有