正在加载图片...
41.1从 Big table说起 Big Table是一个分布式存储系统 Big Table起初用于解决典型的互联网搜索问题 建立互联网索引 1爬虫持续不断地抓取新页面,这些页面每页一行地存储到 Big Table里 2 MapReduce计算作业运行在整张表上,生成索引,为网络搜索应用做准备 搜索互联网 3用户发起网络搜索请求 4网络搜索应用查询建立好的索引,从 Big Table得到网页 5搜索结果提交给用户 contents anchorcnnsi.com""anchormylook.ca <humby com. cnn WWW " CNN "cNn.cOmktg 网页在 Big Table中的存储样例 大数据技术原理与应用(第2版 厦门大学计算机科学系 林子雨 ziyulin@xmu. edu《大数据技术原理与应用(第2版)》 厦门大学计算机科学系 林子雨 ziyulin@xmu.edu.cn 4.1.1从BigTable说起 BigTable是一个分布式存储系统 BigTable起初用于解决典型的互联网搜索问题 •建立互联网索引 1 爬虫持续不断地抓取新页面,这些页面每页一行地存储到BigTable里 2 MapReduce计算作业运行在整张表上,生成索引,为网络搜索应用做准备 •搜索互联网 3 用户发起网络搜索请求 4 网络搜索应用查询建立好的索引,从BigTable得到网页 5 搜索结果提交给用户 网页在BigTable中的存储样例
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有