《大数据技术原理与应用（第2版）》厦门大学计算机科学系林子雨 ziyu

点击下载：厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，2017）第4章分布式数据库HBase

正在加载图片...

4.12 HBase简介关系数据库已经流行很多年,并且 Hadoop已经有了HDFS和 MapReduce, 为什么需要 HBase? Hadoop可以很好地解决大规模数据的离线批量处理问题,但是, 受限于 Hadoop MapReduce编程框架的髙延迟数据处理机制,使得 Hadoop无法满足大规模数据实时处理应用的需求 HDFS面向批量访问模式,不是随机访问模式传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题(分库分表也不能很好解决 ˆ传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间 -因此,业界出现了一类面向半结构化数据存储和处理的高可扩展、低写入/査询延迟的系统,例如,键值数据库、文档数据库和列族数据库(如 Big Table和 HBase等) HBase已经成功应用于互联网服务领域和传统行业的众多在线式数据分析处理系统中《大数据技术原理与应用(第2版厦门大学计算机科学系林子雨 ziyulin@xmu. edu《大数据技术原理与应用（第2版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 4.1.2HBase简介关系数据库已经流行很多年，并且Hadoop已经有了HDFS和MapReduce，为什么需要HBase? •Hadoop可以很好地解决大规模数据的离线批量处理问题，但是，受限于Hadoop MapReduce编程框架的高延迟数据处理机制，使得Hadoop无法满足大规模数据实时处理应用的需求 •HDFS面向批量访问模式，不是随机访问模式 •传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题（分库分表也不能很好解决） •传统关系数据库在数据结构变化时一般需要停机维护；空列浪费存储空间 •因此，业界出现了一类面向半结构化数据存储和处理的高可扩展、低写入/查询延迟的系统，例如，键值数据库、文档数据库和列族数据库（如BigTable和HBase等） •HBase已经成功应用于互联网服务领域和传统行业的众多在线式数据分析处理系统中

<<向上翻页向下翻页>>

点击下载：厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，2017）第4章分布式数据库HBase