第二章 数据库系统原理
第二章 数据库系统原理
本章目录 2.1此为数据库,非彼大数据 2.2数据库技术重要的历史发展阶段 2.3关系模型的直观认知 2.4关系模型的预备知识 2.5关系数据库的基本原理 2.6关系数据库体系的优化设计 2.7本章小结
本 章 目 录 2.1 此为数据库,非彼大数据 2.2 数据库技术重要的历史发展阶段 2.3 关系模型的直观认知 2.4 关系模型的预备知识 2.5 关系数据库的基本原理 2.6 关系数据库体系的优化设计 2.7 本章小结
2.1此为数据库,非彼大数据 数据库领域中的四个基本概念: 概念l数据库(Data Base,DB):接受统一管理的相关数据的集合。 概念2数据库管理系统(Database Management System,DBMS):主 数据 库系统中管理数据的软件系统。它是数据库系统中的核心组成部分,对 数据库的一切操作,包括定义、查询、更新以及各种控制,都是通过 DBMS进行的。 概念3数据库系统(Data Base System,DBS):实现有组织地、动态地 存储大量关联数据,方便多用户访问,由计算机软件、硬件和数据资源 组成的系统。 概念4数据库技术:研究数据库的设计、结构、存取、管理以及应用的 理论体系和实现方法,并利用这些理论和方法,实现对数据库中的数据 进行处理、分析和理解
2.1 此为数据库,非彼大数据 数据库领域中的四个基本概念: 概念1 数据库(DataBase,DB):接受统一管理的相关数据的集合。 概念2 数据库管理系统(Database Management System,DBMS):数据 库系统中管理数据的软件系统。它是数据库系统中的核心组成部分,对 数据库的一切操作,包括定义、查询、更新以及各种控制,都是通过 DBMS进行的。 概念3 数据库系统(Data Base System,DBS):实现有组织地、动态地 存储大量关联数据,方便多用户访问,由计算机软件、硬件和数据资源 组成的系统。 概念4 数据库技术:研究数据库的设计、结构、存取、管理以及应用的 理论体系和实现方法,并利用这些理论和方法,实现对数据库中的数据 进行处理、分析和理解
2.1此为数据库,非彼大数据 以上四个概念,具体的逻辑语义具有内在的递进关系。 (1)概念1数据库的定义中,核心词是“集合”。这是什么对象的集合 呢?前面加了一个定语,即“数据”,拓展后的语义就是“数据的集合 (2)这个“数据的集合”要接受统一的管理,接受谁的统一管理呢?它 接受第二个概念“数据库管理系统”的统一管理。在数据库管理系统的 定义中,“软件系统”是这个概念的核心词。 (3)与“软件系统”对应的概念是“硬件系统”。“数据的集合”和“ 软件系统”都要保存和运行在硬件系统上。为了表示一个集成的大家庭 “数据的集合”“软件系统”和“硬件系统”三大要素集成在一起, 统称为数据库系统。 (4)如何让“数据的集合”“软件系统”和“硬件系统”这三大要素, 有机配合,协同运转?这必然需要一套科学的理论和方法,这就是数据 库技术的内涵所在
2.1 此为数据库,非彼大数据 以上四个概念,具体的逻辑语义具有内在的递进关系。 (1)概念1数据库的定义中,核心词是“集合”。这是什么对象的集合 呢?前面加了一个定语,即“数据”,拓展后的语义就是“数据的集合 ”。 (2)这个“数据的集合”要接受统一的管理,接受谁的统一管理呢?它 接受第二个概念“数据库管理系统”的统一管理。在数据库管理系统的 定义中,“软件系统”是这个概念的核心词。 (3)与“软件系统”对应的概念是“硬件系统”。“数据的集合”和“ 软件系统”都要保存和运行在硬件系统上。为了表示一个集成的大家庭 ,“数据的集合”“软件系统”和“硬件系统”三大要素集成在一起, 统称为数据库系统。 (4)如何让“数据的集合”“软件系统”和“硬件系统”这三大要素, 有机配合,协同运转?这必然需要一套科学的理论和方法,这就是数据 库技术的内涵所在
2.1此为数据库,非彼大数据 这四个概念之间内在的应用逻辑关系如图所示: 数据集合 (DB) 操作方式 事务 锁机制 数据库系统 备份恢复 数据完整 软件+硬件 断点处理 素引 数据库 缓存技术 QL优化 (DBS) 数据库管理系统 软件(DBMS) 数据库技术(理论支撑) 图2-1泛数据库系统基本概念之间的集成关系
2.1 此为数据库,非彼大数据 这四个概念之间内在的应用逻辑关系如图所示:
2.2数据库技术重要的历史发展阶段 数据库技术的早期发展: 20世纪60年代,数据库技术逐渐在以航空票务系统为代表的应用领 域中代替原有的手工操作处理,数据库技术迈出了革命性的一步。早期 的电子数据管理,为了查找和定位数据,往往需要遍历整个数据库,而 早年的数据是磁带存储的模式,磁带存储固有的物理访问方式,客观上 限制了数据查找的速度。 相比数据的人工处理方式,早期的数据库技术虽然大大提高了电子 数据的管理能力,但相对时代的发展需求而言,数据库技术还亟待关键 技术的突破
2.2 数据库技术重要的历史发展阶段 数据库技术的早期发展: 20世纪60年代,数据库技术逐渐在以航空票务系统为代表的应用领 域中代替原有的手工操作处理,数据库技术迈出了革命性的一步。早期 的电子数据管理,为了查找和定位数据,往往需要遍历整个数据库,而 早年的数据是磁带存储的模式,磁带存储固有的物理访问方式,客观上 限制了数据查找的速度。 相比数据的人工处理方式,早期的数据库技术虽然大大提高了电子 数据的管理能力,但相对时代的发展需求而言,数据库技术还亟待关键 技术的突破
2.2数据库技术重要的历史发展阶段 致敬数据库领域的图灵奖获得者: l.第一位图灵奖获得者:查尔斯巴克曼(Charles w.Bachman) (1)1964年,巴克曼在通用电气公司主持设计与开发了最早的网状数据 库管理系统DS,它的设计思想和实现技术被后来的许多网状数据库产品 所仿效。随后十几年,网状数据库管理系统的研发,成为数据库领域的 主流产品和技术发展方向。 (2)巴克曼积极推动数据库标准的制定,在他的努力和推动下,一个标 准的网状数据库模型,以及相关的数据定义和数据操纵语言于1971年被 正式提出。相关报告DBTG成为数据库历史上具有里程碑意义的文献,首 次确定了数据库系统的三层体系结构,明确定义了数据库管理员(Data Base Administrator)的概念、作用与地位
2.2 数据库技术重要的历史发展阶段 致敬数据库领域的图灵奖获得者: 1.第一位图灵奖获得者:查尔斯•巴克曼(Charles W. Bachman) (1)1964年,巴克曼在通用电气公司主持设计与开发了最早的网状数据 库管理系统IDS,它的设计思想和实现技术被后来的许多网状数据库产品 所仿效。随后十几年,网状数据库管理系统的研发,成为数据库领域的 主流产品和技术发展方向。 (2)巴克曼积极推动数据库标准的制定,在他的努力和推动下,一个标 准的网状数据库模型,以及相关的数据定义和数据操纵语言于1971年被 正式提出。相关报告DBTG成为数据库历史上具有里程碑意义的文献,首 次确定了数据库系统的三层体系结构,明确定义了数据库管理员(Data Base Administrator)的概念、作用与地位
2.2数据库技术重要的历史发展阶段 网状数据库技术的优点: 更为直接地表示现实世界 访问性能好 存取效率高 网状数据库技术面临的挑战: 设计数据库的数据结构复杂 数据库逻辑组成与物理存储结构密切相关
2.2 数据库技术重要的历史发展阶段 网状数据库技术的优点: • 更为直接地表示现实世界 • 访问性能好 • 存取效率高 网状数据库技术面临的挑战: • 设计数据库的数据结构复杂 • 数据库逻辑组成与物理存储结构密切相关
2.2数据库技术重要的历史发展阶段 2.第二位图灵奖获得者:埃德加考特(Edgar Frank Codd) 1970年6月,BM圣约瑟研究实验室的高级研究员考特在 Communications of the ACM上发表的《大型共享数据库数据的关系模型》 一文(A Relational Model of Data for Large Shared Data Banks),成为数 据库技术再次突破的历史转折点。在这篇论文中,考特首次明确而清晰 地为未来的数据库发展提出了一种崭新的开发模型,即关系模型,成功 实现了数据库逻辑组成与物理存储结构之间的应用分离和透明集成。在 此基础上,考特提出了关系代数和关系演算的概念,1972年提出了关系 模式的第一、第二、第三范式的定义。1983年,ACM把这篇论文列为自 1958年以来25年中最具里程碑意义的25篇论文之一。考特也因在 “Relational Model”等方面的杰出贡献,于l981年获得计算机领域最高 奖项图灵奖
2.2 数据库技术重要的历史发展阶段 2.第二位图灵奖获得者:埃德加•考特(Edgar Frank Codd) 1970 年 6 月 , IBM 圣 约 瑟 研 究 实 验 室 的 高 级 研 究 员 考 特 在 Communications of the ACM上发表的《大型共享数据库数据的关系模型》 一文(A Relational Model of Data for Large Shared Data Banks),成为数 据库技术再次突破的历史转折点。在这篇论文中,考特首次明确而清晰 地为未来的数据库发展提出了一种崭新的开发模型,即关系模型,成功 实现了数据库逻辑组成与物理存储结构之间的应用分离和透明集成。在 此基础上,考特提出了关系代数和关系演算的概念,1972年提出了关系 模式的第一、第二、第三范式的定义。1983年,ACM把这篇论文列为自 1958 年以来25年中最具里程碑意义的25 篇论文之一。考特也因在 “Relational Model”等方面的杰出贡献,于1981年获得计算机领域最高 奖项图灵奖
2.2数据库技术重要的历史发展阶段 “关系”(relation)是数学领域中的一个基本概念,即由集合中的任 意元素所组成的若干有序偶表示,用以反映客观事物间的联系,如数之 间的大小关系、人之间的亲属关系、商品流通中的购销关系等。计算机 学科中,计算机的逻辑设计、编译程序设计、算法分析与程序结构、信 息检索等,都运用了关系的概念。而用关系的概念建立数据库中的数据 模型,用以描述、设计与操纵数据库,则是考特的杰出贡献。关系模型 建立在严格的集合概念的基础之上,无论是实体还是实体之间的联系都 用关系来表示,对数据的检索和更新结果也是基于关系(表)的。所以 ,数据结构简单清晰,用户易懂易用。关系模型的存取路径对用户透明 从而具有较高的数据独立性、更好的安全保密性,也简化了程序员的 工作和数据库开发建立的工作
2.2 数据库技术重要的历史发展阶段 “关系”(relation)是数学领域中的一个基本概念,即由集合中的任 意元素所组成的若干有序偶表示,用以反映客观事物间的联系,如数之 间的大小关系、人之间的亲属关系、商品流通中的购销关系等。计算机 学科中,计算机的逻辑设计、编译程序设计、算法分析与程序结构、信 息检索等,都运用了关系的概念。而用关系的概念建立数据库中的数据 模型,用以描述、设计与操纵数据库,则是考特的杰出贡献。关系模型 建立在严格的集合概念的基础之上,无论是实体还是实体之间的联系都 用关系来表示,对数据的检索和更新结果也是基于关系(表)的。所以 ,数据结构简单清晰,用户易懂易用。关系模型的存取路径对用户透明 ,从而具有较高的数据独立性、更好的安全保密性,也简化了程序员的 工作和数据库开发建立的工作