第11章 NOSQL数据库
第11章 NoSQL数据库
提纲 111 NOSQL简介 112 NOSQL兴起的原因 113 NOSQL与关系数据库的比较 114 NOSQL的四大类型 115 NOSQL的三大基石 116从 NOSQL到 NewSQL数据库 117文档数据库 MongoDB
提纲 • 11.1 NoSQL简介 • 11.2 NoSQL兴起的原因 • 11.3 NoSQL与关系数据库的比较 • 11.4 NoSQL的四大类型 • 11.5 NoSQL的三大基石 • 11.6 从NoSQL到NewSQL数据库 • 11.7 文档数据库MongoDB
11.1 NOSQL简介 SOI 概念演变 Not only SQL 最初表示“反SQL”运动 现在表示关系和非关系型数据库各有优缺点 用新型的非关系数据库取代关系数据库 彼此都无法互相取代 通常, NOSQL数据库具有以下几个特点 (1)灵活的可扩展性 (2)灵活的数据模型 (3)与云计算紧密融合
11.1 NoSQL简介 通常,NoSQL数据库具有以下几个特点: (1)灵活的可扩展性 (2)灵活的数据模型 (3)与云计算紧密融合 最初表示“反SQL”运动 用新型的非关系数据库取代关系数据库 现在表示关系和非关系型数据库各有优缺点 彼此都无法互相取代 概念演变
11.1 NOSQL简介 现在已经有很多公司使用了 NOSQL数据库 . Gooo」le .Facebook . Mozilla Adobe ° -oursquare Linkedin Di McGraw-Hill Education Vermont public radio ·百度、腾讯、阿里、新浪、华为.…
11.1 NoSQL简介 现在已经有很多公司使用了NoSQL数据库: •Google •Facebook •Mozilla •Adobe •Foursquare •LinkedIn •Digg •McGraw-Hill Education •Vermont Public Radio •百度、腾讯、阿里、新浪、华为……
112 NOSQL兴起的原因 1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面: (1)无法满足海量数据的管理需求 (2)无法满足数据高并发的需求 (3)无法满足高可扩展性和高可用性的需求 1分钟时间 ●新浪可以发送2万条微博 ●苹果可以下载4,万次应用 ●淘宝可以卖出6万件商品 ●人人网可以发生30万次访问 ●百度可以产生90万次搜索查询 人
11.2 NoSQL兴起的原因 1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面: (1)无法满足海量数据的管理需求 (2)无法满足数据高并发的需求 (3)无法满足高可扩展性和高可用性的需求
112 NOSQL兴起的原因 MySQL集群是否可以完全解决问题? 复杂性:部署、管理、配置很复杂 数据库复制: MySQL主备之间采用复 制方式,只能是异步复制,当主库压力 分库1 分库2 分 分库4 较大时可能产生较大延迟,主备切换可 能会丢失最后一部分更新事务,这时往 往需要人工介入,备份和恢复不方便 :M*S:::: M!S:: M::S::::: M 啸扩容问题:如果系统压力过大需要增加 新的机器,这个过程涉及数据重新划分 ,整个过程比较复杂,且容易出错 动态数据迁移问题:如果某个数据库组 物理机 物理机 物理机 物理机 压力过大,需要将其中部分数据迁移出 去,迁移过程需要总控节点整体协调, 以及数据库节点的配合。这个过程很难 做到自动化
11.2 NoSQL兴起的原因 •复杂性:部署、管理、配置很复杂 •数据库复制:MySQL主备之间采用复 制方式,只能是异步复制,当主库压力 较大时可能产生较大延迟,主备切换可 能会丢失最后一部分更新事务,这时往 往需要人工介入,备份和恢复不方便 •扩容问题:如果系统压力过大需要增加 新的机器,这个过程涉及数据重新划分 ,整个过程比较复杂,且容易出错 •动态数据迁移问题:如果某个数据库组 压力过大,需要将其中部分数据迁移出 去,迁移过程需要总控节点整体协调, 以及数据库节点的配合。这个过程很难 做到自动化 MySQL集群是否可以完全解决问题?
112 NOSQL兴起的原因 2、“ One size fits訓”模式很难适用于截然不同的业务场景 关系模型作为统一的数据模型既被用于数据分析,也被用于在线业 务。但这两者一个强调高吞吐,一个强调低延时,已经演化出完全 不同的架构。用同一套模型来抽象显然是不合适的 Hadoop就是针对数据分析 MongoDB、 Redis等是针对在线业务,两者都抛弃了关系模型
11.2 NoSQL兴起的原因 2、“One size fits all”模式很难适用于截然不同的业务场景 •关系模型作为统一的数据模型既被用于数据分析,也被用于在线业 务。但这两者一个强调高吞吐,一个强调低延时,已经演化出完全 不同的架构。用同一套模型来抽象显然是不合适的 •Hadoop就是针对数据分析 •MongoDB、Redis等是针对在线业务,两者都抛弃了关系模型
112 NOSQL兴起的原因 3、关系数据库的关键特性包括完善的事务机制和高效的査询机制。但是 关系数据库引以为傲的两个关键特性,到了Web2.0时代却成了鸡肋,主要 表现在以下几个方面: (1)Web20网站系统通常不要求严格的数据库事务 (2)Web20并不要求严格的读写实时性 (3)Web2.0通常不包含大量复杂的SQL查询(去结构化,存储空间换取 更好的查询性能)
11.2 NoSQL兴起的原因 3、关系数据库的关键特性包括完善的事务机制和高效的查询机制。但是, 关系数据库引以为傲的两个关键特性,到了Web2.0时代却成了鸡肋,主要 表现在以下几个方面: (1)Web2.0网站系统通常不要求严格的数据库事务 (2)Web2.0并不要求严格的读写实时性 (3)Web2.0通常不包含大量复杂的SQL查询(去结构化,存储空间换取 更好的查询性能)
11.3 NOSQL与关系数据库的比较 表11-1 NOSQL和关系数据库的简单比较 比较标准 RDBMSNoSQL 备注 数据库原理 完全支持 部分支持 RDBMS有关系代数理论作为基础 NOSQL没有统一的理论基础 RDBMS很难实现横向扩展,纵向扩展的空间也比较 数据规模 大 超大 有限,性能会随着数据规模的增大而降低 NOSQL可以很容易通过添加更多设备来支持更大规 模的数据 RDBMS需要定义数据库模式,严格遵守数据定义和 数据库模式 固定 灵活 相关约束条件 NOSQL不存在数据库模式,可以自由灵活定义并存 储各种不同类型的数据 简单查询,但是 RDBMS借助于素引机制可以实现快速查询(包括记 查询效率 快 不具备高度结构很多 NOSQL数据库没有面向复杂查询的索引,虽然 化查询等特性, NSQL可以使用 MapReduce来加速查询,但是,在 复杂查询的性能复杂查询方面的性能仍然不如 IRDBMS
11.3 NoSQL与关系数据库的比较 比较标准 RDBMS NoSQL 备注 数据库原理 完全支持 部分支持 RDBMS有关系代数理论作为基础 NoSQL没有统一的理论基础 数据规模 大 超大 RDBMS很难实现横向扩展,纵向扩展的空间也比较 有限,性能会随着数据规模的增大而降低 NoSQL可以很容易通过添加更多设备来支持更大规 模的数据 数据库模式 固定 灵活 RDBMS需要定义数据库模式,严格遵守数据定义和 相关约束条件 NoSQL不存在数据库模式,可以自由灵活定义并存 储各种不同类型的数据 查询效率 快 可以实现高效的 简单查询,但是 不具备高度结构 化查询等特性, 复杂查询的性能 不尽人意 RDBMS借助于索引机制可以实现快速查询(包括记 录查询和范围查询) 很多NoSQL数据库没有面向复杂查询的索引,虽然 NoSQL可以使用MapReduce来加速查询,但是,在 复杂查询方面的性能仍然不如RDBMS 表11-1 NoSQL和关系数据库的简单比较
11.3 NOSQL与关系数据库的比较 表11-1 NOSQL和关系数据库的简单比较(续) 比较标准 RDBMS NoSQL 备注 RDBMS严格遵守事务AC|D模型,可以保证事 一致性强一致性弱一致性很多N0sOL数据库放松了对事务ACD四性的要 求,而是遵守BASE模型,只能保证最终一致性 任何一个 RDBMS都可以很容易实现数据完整性 比如通过主键或者非空约束来实现实体完整性 数据完整性容易实现很难实现通过主键、外键来实现参照完整性,通过约束 或者触发器来实现用户自定义完整性 但是,在 NoSQL数据库却无法实现 RDBMS很难实现横向扩展,纵向扩展的空间也 扩展性 般 比较有限 NOSQL在设计之初就充分考虑了横向扩展的需 求,可以很容易通过添加廉价设备实现扩展 RDBMS在任何时候都以保证数据一致性为优先 目标,其次才是优化系统性能,随着数据规模 可用性 好 很好的增大, RDBMS为了保证严格的一致性,只能 提供相对较弱的可用性 大多数 NOSQL都能提供较高的可用性
11.3 NoSQL与关系数据库的比较 比较标准 RDBMS NoSQL 备注 一致性 强一致性 弱一致性 RDBMS严格遵守事务ACID模型,可以保证事 务强一致性 很多NoSQL数据库放松了对事务ACID四性的要 求,而是遵守BASE模型,只能保证最终一致性 数据完整性 容易实现 很难实现 任何一个RDBMS都可以很容易实现数据完整性, 比如通过主键或者非空约束来实现实体完整性, 通过主键、外键来实现参照完整性,通过约束 或者触发器来实现用户自定义完整性 但是,在NoSQL数据库却无法实现 扩展性 一般 好 RDBMS很难实现横向扩展,纵向扩展的空间也 比较有限 NoSQL在设计之初就充分考虑了横向扩展的需 求,可以很容易通过添加廉价设备实现扩展 可用性 好 很好 RDBMS在任何时候都以保证数据一致性为优先 目标,其次才是优化系统性能,随着数据规模 的增大,RDBMS为了保证严格的一致性,只能 提供相对较弱的可用性 大多数NoSQL都能提供较高的可用性 表11-1 NoSQL和关系数据库的简单比较(续)