正在加载图片...
4.12 HBase简介 关系数据库已经流行很多年,并且 Hadoop已经有了HDFS和 MapReduce, 为什么需要 HBase? Hadoop可以很好地解决大规模数据的离线批量处理问题,但是, 受限于 Hadoop MapReduce编程框架的髙延迟数据处理机制,使 得 Hadoop无法满足大规模数据实时处理应用的需求 HDFS面向批量访问模式,不是随机访问模式 传统的通用关系型数据库无法应对在数据规模剧增时导致的系统 扩展性和性能问题(分库分表也不能很好解决 ˆ传统关系数据库在数据结构变化时一般需要停机维护;空列浪费 存储空间 -因此,业界出现了一类面向半结构化数据存储和处理的高可扩展、 低写入/査询延迟的系统,例如,键值数据库、文档数据库和列族 数据库(如 Big Table和 HBase等) HBase已经成功应用于互联网服务领域和传统行业的众多在线式 数据分析处理系统中 《大数据技术原理与应用(第2版 厦门大学计算机科学系 林子雨 ziyulin@xmu. edu《大数据技术原理与应用(第2版)》 厦门大学计算机科学系 林子雨 ziyulin@xmu.edu.cn 4.1.2HBase简介 关系数据库已经流行很多年,并且Hadoop已经有了HDFS和MapReduce, 为什么需要HBase? •Hadoop可以很好地解决大规模数据的离线批量处理问题,但是, 受限于Hadoop MapReduce编程框架的高延迟数据处理机制,使 得Hadoop无法满足大规模数据实时处理应用的需求 •HDFS面向批量访问模式,不是随机访问模式 •传统的通用关系型数据库无法应对在数据规模剧增时导致的系统 扩展性和性能问题(分库分表也不能很好解决) •传统关系数据库在数据结构变化时一般需要停机维护;空列浪费 存储空间 •因此,业界出现了一类面向半结构化数据存储和处理的高可扩展、 低写入/查询延迟的系统,例如,键值数据库、文档数据库和列族 数据库(如BigTable和HBase等) •HBase已经成功应用于互联网服务领域和传统行业的众多在线式 数据分析处理系统中
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有