莲喇4桂降发多六毒 管理信息系统 第三讲数据库与数据库管理 【教学目的和要求】 1.理解数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程和特点 2. 数据库系统的体系结构 3. 掌握从现实世界到概念模型和数据模型抽象的含义,不同的数据库模型,实体关系图画法, 4. 理解数据库管理系统(DBMS)的功能及其工作过程 6 了解多媒体数据库的组成 6. 了解数据仓库和数据挖掘的概念 【主要内容】 3.1数据库与数据库营理系统 3.1.1数据库技术的发展 3.1.2数据库系统的体系结构 3.1.3数据模型 3.1.4数据库管理系统(DBMS)的功能及其工作过程 3.2数据仓库和数据挖掘(阅读) 3.2.1数据仓库的概念 3.2.2为什么需要数据仓库 3.2.3数据仓库的价值 3.2.4数据仓库框架结构 3.2.5数据挖掘 小结 习题三 案例 【电子教案】 参见:第三讲数据库与数据库系统 【重点与难点】 1. 数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程 2. 数据库系统的体系结构: 3. 数据模型。 【教材和参考读物】 《管理信息系统一一理论与实践》第三章 《管理信息系统》甘仞初第三章 【教学时数】2 第1页共19页
管理信息系统 第三讲 数据库与数据库管理 【教学目的和要求】 1. 理解数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程和特点 2. 数据库系统的体系结构 3. 掌握从现实世界到概念模型和数据模型抽象的含义,不同的数据库模型,实体关系图画法, 4. 理解数据库管理系统(DBMS)的功能及其工作过程 5. 了解多媒体数据库的组成 6. 了解数据仓库和数据挖掘的概念 【主要内容】 3.1 数据库与数据库管理系统 3.1.1 数据库技术的发展 3.1.2 数据库系统的体系结构 3.1.3 数据模型 3.1.4 数据库管理系统(DBMS)的功能及其工作过程 3.2 数据仓库和数据挖掘(阅读) 3.2.1 数据仓库的概念 3.2.2 为什么需要数据仓库 3.2.3 数据仓库的价值 3.2.4 数据仓库框架结构 3.2.5 数据挖掘 小结 习题三 案例 【电子教案】 参见:第三讲数据库与数据库系统 【重点与难点】 1. 数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程 2. 数据库系统的体系结构; 3. 数据模型。 【教材和参考读物】 《管理信息系统——理论与实践》第三章 《管理信息系统》甘仞初 第三章 【教学时数】 2 第 1 页 共 19 页
肖好经份餐多大景 管理信息系统 第3讲数据库与信息管理 数据库技术是计算机科学的一个重要分支。20世纪50年代以来,计算机应用由科学研究逐步扩 展到企业、政府部门和社会的各个领域,数据处理很快上升为计算机应用的一个最重要的方面。自 1968年第一个商品化数据管理系统问世以来,数据库技术得到迅速发展。近年来,随着网络技术和 多媒体技术的发展,基于互联网的融合多媒体技术的数据库技术显示出更为广阔的技术前景,成为 信息管理、办公自动化的主要技术支持手段。 数据库技术研究如何科学地组织数据和存储数据,如何高效地检索数据和处理数据,以及如何 既减少数据冗余,又能保障数据安全,实现数据共享。在计算机应用的领域中,管理信息系统方面 的应用占90%以上,而数据库技术又是管理信息系统的基础。因此,可以说,数据库是当今计算机 应用中覆盖范围最为广泛的应用。 3.1 数据库与数据库管理系统 3.1.1数据库技术的发展 数据处理的首要任务是数据管理。数据管理是指如何分类、组织、存储、检索及维护数据库。 数据管理技术经历了人工管理、文件管理、数据库系统三个阶段。表3-1给出了三个阶段的特征比 较。 表3-1数据管理的三个阶段 人工管理 文件管理 数据库管理 数据管理者 用户 文件系统 数据库管理系统 面向的对象 某个应用程序 某个应用 多个应用 共享程度 无共享,冗余度大 共享性差,冗余度大 共享性好,冗余度小 不独立,与程序一 独立性差, 与程序相 具有高度的物理独立性和逻 独立性 体化 关性强 辑独立性 文件形式多样化,单 整体结构化程度高,以数据 结构化 无结构 个文件有记录结构, 模型描述 文件之间是独立的 数据库管理系统提供安全 控制 应用程序自己控制 应用程序自己控制 性、完整性、并发控制和恢 复能力 1.人工管理阶段 从1946年计算机诞生至20世纪50年代中期,计算机主要用于科学计算。计算机除硬件设备外 没有任何软件可用,使用的外存只有磁带、卡片和纸带,没有磁盘等直接存取设备。软件中只有汇 编语言,没有操作系统,对数据的处理,完全由人工进行管理。 人工管理阶段的数据模型如图3-1所示。图中显示程序和数据是一体化的,虽然以虚线将程序和 数据分成两部分,事实上,它们之间是混为一体的。 第2页共19页
管理信息系统 第 3 讲 数据库与信息管理 数据库技术是计算机科学的一个重要分支。20 世纪 50 年代以来,计算机应用由科学研究逐步扩 展到企业、政府部门和社会的各个领域,数据处理很快上升为计算机应用的一个最重要的方面。自 1968 年第一个商品化数据管理系统问世以来,数据库技术得到迅速发展。近年来,随着网络技术和 多媒体技术的发展,基于互联网的融合多媒体技术的数据库技术显示出更为广阔的技术前景,成为 信息管理、办公自动化的主要技术支持手段。 数据库技术研究如何科学地组织数据和存储数据,如何高效地检索数据和处理数据,以及如何 既减少数据冗余,又能保障数据安全,实现数据共享。在计算机应用的领域中,管理信息系统方面 的应用占 90%以上,而数据库技术又是管理信息系统的基础。因此,可以说,数据库是当今计算机 应用中覆盖范围最为广泛的应用。 3.1 数据库与数据库管理系统 3.1.1 数据库技术的发展 数据处理的首要任务是数据管理。数据管理是指如何分类、组织、存储、检索及维护数据库。 数据管理技术经历了人工管理、文件管理、数据库系统三个阶段。表 3-1 给出了三个阶段的特征比 较。 表 3-1 数据管理的三个阶段 人工管理 文件管理 数据库管理 数据管理者 用户 文件系统 数据库管理系统 面向的对象 某个应用程序 某个应用 多个应用 共享程度 无共享,冗余度大 共享性差,冗余度大 共享性好,冗余度小 独立性 不独立,与程序一 体化 独立性差,与程序相 关性强 具有高度的物理独立性和逻 辑独立性 结构化 无结构 文件形式多样化,单 个文件有记录结构, 文件之间是独立的 整体结构化程度高,以数据 模型描述 控制 应用程序自己控制 应用程序自己控制 数据库管理系统提供安全 性、完整性、并发控制和恢 复能力 1. 人工管理阶段 从 1946 年计算机诞生至 20 世纪 50 年代中期,计算机主要用于科学计算。计算机除硬件设备外 没有任何软件可用,使用的外存只有磁带、卡片和纸带,没有磁盘等直接存取设备。软件中只有汇 编语言,没有操作系统,对数据的处理,完全由人工进行管理。 人工管理阶段的数据模型如图 3-1 所示。图中显示程序和数据是一体化的,虽然以虚线将程序和 数据分成两部分,事实上,它们之间是混为一体的。 第 2 页 共 19 页
莲喇南餐多六号 管理信息系统 程序1← 数据集1 程序2←÷→ 数据集2 程序N← 数据集N 图3-1数据人工管理模型 在人工管理阶段,数据管理呈现如下特点: ●数据不保存。一组数据对应于一个应用程序,应用程序与其处理的数据结合成一个整体。 在进行计算时,系统将应用程序和数据一起装入,程序运行结束后,释放内存空间,程序 和数据同时被撤销。 ●没有软件对数据进行管理。应用程序设计者不仅要考虑数据之间的逻辑关系,还要考虑存 储结构、存取方法以及输入方式等。如果存储结构发生变化,程序中读写数据的程序也要 发生改变,数据没有独立性。 ●没有文件概念。数据的组织方法由程序设计人员自行设计和安排。 ● 数据面向应用。数据附属于程序,即使两个应用程序使用相同的数据,也必须各自定义数 据的存储和存取方式,不能共享相同的数据定义,因此,程序与程序之间可能有大量的重 复数据。 2.文件管理阶段 20世纪50年代后期到60年代中期,计算机不仅用于科学计算,也大量用于经营管理活动。硬 件设备有了磁盘、磁鼓等直接存储设备:软件发展了操作系统和各种高级语言。 文件系统的模型如图3-2所示。通过文件系统,程序和数据之间有了比较清晰的边界。不同的 程序可以使用相同的文件,反过来,一个程序也可以访问不同的文件。 文件系统阶段数据管理有如下特点: ·数据可长期保存在磁盘上。用户可通过程序对文件进行查询、修改、插入或删除操作。 ●文件系统提供程序和数据之间的读写方法。文件管理系统是应用程序与数据文件之间的一 个接口。应用程序通过文件管理系统建立和存储文件:反之,应用程序要存取文件中的数 据,必须通过文件管理系统实现。用户不必关心数据的物理位置,程序和数据之间有了一 定的独立性。 ●文件形式多样化。因为有了直接存取设备,所以可以建立索引文件、链接文件和直接存取 文件等。对文件的记录可顺序访问和随机访问。文件之间是相互独立的,文件与文件之间 的联系需要用程序实现。 数据的存取基本上以记录为单位。 第3页共19页
管理信息系统 程序 1 数据集 1 程序 2 数据集 2 程序 N 数据集 N 图 3-1 数据人工管理模型 在人工管理阶段,数据管理呈现如下特点: z 数据不保存。一组数据对应于一个应用程序,应用程序与其处理的数据结合成一个整体。 在进行计算时,系统将应用程序和数据一起装入,程序运行结束后,释放内存空间,程序 和数据同时被撤销。 z 没有软件对数据进行管理。应用程序设计者不仅要考虑数据之间的逻辑关系,还要考虑存 储结构、存取方法以及输入方式等。如果存储结构发生变化,程序中读写数据的程序也要 发生改变,数据没有独立性。 z 没有文件概念。数据的组织方法由程序设计人员自行设计和安排。 z 数据面向应用。数据附属于程序,即使两个应用程序使用相同的数据,也必须各自定义数 据的存储和存取方式,不能共享相同的数据定义,因此,程序与程序之间可能有大量的重 复数据。 2. 文件管理阶段 20 世纪 50 年代后期到 60 年代中期,计算机不仅用于科学计算,也大量用于经营管理活动。硬 件设备有了磁盘、磁鼓等直接存储设备;软件发展了操作系统和各种高级语言。 文件系统的模型如图 3-2 所示。通过文件系统,程序和数据之间有了比较清晰的边界。不同的 程序可以使用相同的文件,反过来,一个程序也可以访问不同的文件。 文件系统阶段数据管理有如下特点: z 数据可长期保存在磁盘上。用户可通过程序对文件进行查询、修改、插入或删除操作。 z 文件系统提供程序和数据之间的读写方法。文件管理系统是应用程序与数据文件之间的一 个接口。应用程序通过文件管理系统建立和存储文件;反之,应用程序要存取文件中的数 据,必须通过文件管理系统实现。用户不必关心数据的物理位置,程序和数据之间有了一 定的独立性。 z 文件形式多样化。因为有了直接存取设备,所以可以建立索引文件、链接文件和直接存取 文件等。对文件的记录可顺序访问和随机访问。文件之间是相互独立的,文件与文件之间 的联系需要用程序实现。 z 数据的存取基本上以记录为单位。 第 3 页 共 19 页
莲喇头特倚餐多本居 管理信息系统 文件1 程序1 文件2 文件系统 程序2 文件3 程序3 图3-2文件系统模型 文件系统的缺陷是: 。数据冗余大,因为文件是为特定的用途设计的,因此会造成数据在多个文件中重复存储。 ●数据的不一致。这是由数据冗余和文件之间的独立性造成,在更新数据时,很难保证同一 数据在不同文件中的统一。 ·程序与数据之间的独立性差。修改文件的存储结构后,相关的程序也要修改。 3.数据库管理阶段 20世纪60年代后期开始,存储技术有了很大的发展,产生了大容量磁盘。计算机用于管理的规 模更加庞大,数据量急剧增长,为了提高效率,人们着手开发和研制更加有效的数据管理模式,并 由此提出了数据库的概念。 1968年,IBM公司研制成功数据库管理系统(Information Management System,IMS)标志着数 据管理技术进入了数据库阶段。MS为层次型数据库。l969年,美国数据系统语言协会(Conference On Data System Language)公布了数据库工作组报告,对研制开发网状数据库起了巨大推动作用。l970 年,BM公司的研究员EE.Codd连续发表论文,奠定了关系数据库的基础。 数据库系统的数据存取模型如图3-3所示。 应用程序1 数据库 应用程序2 管理系统 数据库 。。。。 应用程序n 图3-3数据共享示意图 与文件管理相比,数据库技术有了很大的改进,主要表现为: ●数据库中的数据是结构化的。在文件系统中,数据是无结构的,即不同文件中的记录之间 第4页共19页
管理信息系统 程序 1 程序 2 程序 3 文件 1 文件 2 文件 3 文件系统 图 3-2 文件系统模型 文件系统的缺陷是: z 数据冗余大,因为文件是为特定的用途设计的,因此会造成数据在多个文件中重复存储。 z 数据的不一致。这是由数据冗余和文件之间的独立性造成,在更新数据时,很难保证同一 数据在不同文件中的统一。 z 程序与数据之间的独立性差。修改文件的存储结构后,相关的程序也要修改。 3. 数据库管理阶段 20 世纪 60 年代后期开始,存储技术有了很大的发展,产生了大容量磁盘。计算机用于管理的规 模更加庞大,数据量急剧增长,为了提高效率,人们着手开发和研制更加有效的数据管理模式,并 由此提出了数据库的概念。 1968 年,IBM 公司研制成功数据库管理系统(Information Management System,IMS)标志着数 据管理技术进入了数据库阶段。IMS 为层次型数据库。1969 年,美国数据系统语言协会(Conference On Data System Language)公布了数据库工作组报告,对研制开发网状数据库起了巨大推动作用。1970 年,IBM 公司的研究员 E F. Codd 连续发表论文,奠定了关系数据库的基础。 数据库系统的数据存取模型如图 3-3 所示。 应用程序 1 数据库 应用程序 2 图 3-3 数据共享示意图 与文件管理相比,数据库技术有了很大的改进,主要表现为: z 数据库中的数据是结构化的。在文件系统中,数据是无结构的,即不同文件中的记录之间 应用程序 n 管理系统 数据库 ···· 第 4 页 共 19 页
肖外垤悔贸多大是 管理信息系统 没有联系,它只在数据项之间有联系。数据库系统不仅考虑数据项之间的联系,还要考虑 记录之间的联系,这种联系是通过存储路径来实现的。 ●数据库中的数据是面向系统的,对于任何一个系统来说,数据库中的数据结构是透明的。 任何应用程序都可以通过标准化接口访问数据库,如图3-3所示。 数据库系统比文件系统有较高的数据独立性。 ● 数据库系统为用户提供了方便统一的接口。用户可以用数据库系统提供的查询语言和交互 式命令操纵数据库。用户也可以用高级语言编写程序来访问数据库,扩展了数据库的应用 范围。 不仅如此,数据库技术的发展使数据管理上了一个新台阶,在数据完整性、安全性、并发访问 和数据恢复方面,数据库管理系统都提供了非常完善的功能选择。 ●数据完整性 保证数据库存储数据的正确性。例如预定同一班飞机的旅客不能超过飞机的定员数:定购货物 中,订货日期不能大于发货日期。使用数据库系统提供的存取方法,设计一些完整性规则,对数据 值之间的联系进行校验,可以保证数据库中数据的正确性。 ●数据安全性 并非每个应用都可以存取数据库中的全部数据。例如在一个人事档案数据库中,只有被授权的 访问者才可以读取数据,并进行修改:其他访问者的权限一般限于浏览特定的数据项,而不是全部 数据。 ●并发控制 当多个用户同时存取、修改数据库中的数据时,可能会发生相互干扰,使数据库中的数据完整 性受到破坏,而导致数据的不一致。数据库并发控制防止了这种现象的发生,提高了数据库的访问 效率。 ●数据库的恢复 任何系统都不可能永远正确无误地工作,数据库系统也是如此。运行过程中,会出现硬件或软 件的故障。数据库系统具有恢复能力,能把数据库恢复到最近某个时刻的正确状态。 3.1.2数据库系统的体系结构 可以从不同的角度分析数据库系统的体系结构,从DBMS角度看,数据库系统采用三级模式结构, 也就是内模式、外模式和概念模式;从数据库的物理分布来考察,又分为集中式数据库、C/S结构、 B/S结构等,这就是数据库系统的体系结构。 目前市场上流行的数据库系统软件产品多种多样,支持不同的数据模型,使用不同的数据库语言 和应用系统开发工具,建立在不同的操作系统之上,但绝大多数数据库都具有三级模式的特征。数 据库的三级模式分为:外模式、内模式和概念模式,如图3-4所示。 第5页共19页
管理信息系统 没有联系,它只在数据项之间有联系。数据库系统不仅考虑数据项之间的联系,还要考虑 记录之间的联系,这种联系是通过存储路径来实现的。 z 数据库中的数据是面向系统的,对于任何一个系统来说,数据库中的数据结构是透明的。 任何应用程序都可以通过标准化接口访问数据库,如图 3-3 所示。 z 数据库系统比文件系统有较高的数据独立性。 z 数据库系统为用户提供了方便统一的接口。用户可以用数据库系统提供的查询语言和交互 式命令操纵数据库。用户也可以用高级语言编写程序来访问数据库,扩展了数据库的应用 范围。 不仅如此,数据库技术的发展使数据管理上了一个新台阶,在数据完整性、安全性、并发访问 和数据恢复方面,数据库管理系统都提供了非常完善的功能选择。 z 数据完整性 保证数据库存储数据的正确性。例如预定同一班飞机的旅客不能超过飞机的定员数;定购货物 中,订货日期不能大于发货日期。使用数据库系统提供的存取方法,设计一些完整性规则,对数据 值之间的联系进行校验,可以保证数据库中数据的正确性。 z 数据安全性 并非每个应用都可以存取数据库中的全部数据。例如在一个人事档案数据库中,只有被授权的 访问者才可以读取数据,并进行修改;其他访问者的权限一般限于浏览特定的数据项,而不是全部 数据。 z 并发控制 当多个用户同时存取、修改数据库中的数据时,可能会发生相互干扰,使数据库中的数据完整 性受到破坏,而导致数据的不一致。数据库并发控制防止了这种现象的发生,提高了数据库的访问 效率。 z 数据库的恢复 任何系统都不可能永远正确无误地工作,数据库系统也是如此。运行过程中,会出现硬件或软 件的故障。数据库系统具有恢复能力,能把数据库恢复到最近某个时刻的正确状态。 3.1.2 数据库系统的体系结构 可以从不同的角度分析数据库系统的体系结构,从 DBMS 角度看,数据库系统采用三级模式结构, 也就是内模式、外模式和概念模式;从数据库的物理分布来考察,又分为集中式数据库、C/S 结构、 B/S 结构等,这就是数据库系统的体系结构。 目前市场上流行的数据库系统软件产品多种多样,支持不同的数据模型,使用不同的数据库语言 和应用系统开发工具,建立在不同的操作系统之上,但绝大多数数据库都具有三级模式的特征。数 据库的三级模式分为:外模式、内模式和概念模式,如图 3-4 所示。 第 5 页 共 19 页
链喇4舍贸多本号 管理信息系统 应用A 应用B 应用C 应用D 应用E 外模式 外模式 外模式 概念模式 DBMS 内模式 数据库 图3-4数据库三级模式 外模式定义了允许用户操作的数据库数据,也称为用户模式或子模式。对最终用户来讲,所看 到的视图就是外模式。由于不同用户需求相差很大,看待数据的方式与所使用的数据内容各不相同, 对数据的保密性要求也各有差异,因此,不同用户的外模式也不相同。 概念模式,简称为模式,是数据库全部数据的逻辑结构和特征描述,它以数据模型为基础,采 用数据库系统提供的模式描述语言进行定义,可以被看作是现实世界中一个组织或部门中实体及其 联系的抽象模型在数据库系统中的实现。概念模式不同于外模式,与具体的应用程序无关:也不同 于内模式,与数据库的硬件环境与存储格式无关。 概念模式不仅要定义数据的逻辑结构,而且要定义与数据有关的安全性和完整性;不仅要定义 数据记录的内部结构,还要定义这些数据之间的联系。 内模式也称为存储模式,用来描述数据的物理结构和存储方式。 数据库三级模式的意义在于提供数据的层次结构,保持数据的独立性。内模式到概念模式之间 的分割提供了数据的物理独立性,即当数据的物理结构发生变化时,如存储设备的改变、数据存储 位置或存储组织方式的改变等,不影响数据的逻辑结构。例如,为了提高数据的存取效率,数据库 设计人员重新组织数据的物理组织,这种改变由于内模式与概念模式的存在,而使得数据的概念模 式不会受到影响,也不需要修改应用程序。 概念模式到外模式的映像提供了数据的逻辑独立性,即当数据的整体逻辑结构发生变化时,如 为原有记录增加新的数据项、在概念模式中增加新的数据类型、增加新的数据库记录等,都不影响 外模式。例如,在采购系统中,因为产品结构的变化,采购的零部件需要增、删、修改、更新等, 根据新的数据需求修改数据库之后,并不引起应用程序的变化。 数据库的三级模式,提供了高度的数据独立性。其中,数据库的全局逻辑描述是独立于其他所 有结构描述的,在定义数据库结构时,应该首先定义概念模式。内模式则是将概念模式中所定义的 数据进行适当的组织并加以存储,以实现较好的时空效率。 总之,数据库的三级模式是数据库管理的结构框架,依照这些数据框架组织的数据才是数据库 内容。在数据库设计时,主要是定义数据库的三级模式,而在用户使用数据库时,关心的是数据库 的内容。数据库的模式通常是稳定的,而数据库的数据通常是经常变化的,特别是来自企业业务流 程的数据,数据始终处于动态变化之中。 第6页共19页
管理信息系统 内模式 概念模式 外模式 外模式 外模式 应用 B 应用 C 应用 D 应用 E DBMS 应用 A 数据库 图 3-4 数据库三级模式 外模式定义了允许用户操作的数据库数据,也称为用户模式或子模式。对最终用户来讲,所看 到的视图就是外模式。由于不同用户需求相差很大,看待数据的方式与所使用的数据内容各不相同, 对数据的保密性要求也各有差异,因此,不同用户的外模式也不相同。 概念模式,简称为模式,是数据库全部数据的逻辑结构和特征描述,它以数据模型为基础,采 用数据库系统提供的模式描述语言进行定义,可以被看作是现实世界中一个组织或部门中实体及其 联系的抽象模型在数据库系统中的实现。概念模式不同于外模式,与具体的应用程序无关;也不同 于内模式,与数据库的硬件环境与存储格式无关。 概念模式不仅要定义数据的逻辑结构,而且要定义与数据有关的安全性和完整性;不仅要定义 数据记录的内部结构,还要定义这些数据之间的联系。 内模式也称为存储模式,用来描述数据的物理结构和存储方式。 数据库三级模式的意义在于提供数据的层次结构,保持数据的独立性。内模式到概念模式之间 的分割提供了数据的物理独立性,即当数据的物理结构发生变化时,如存储设备的改变、数据存储 位置或存储组织方式的改变等,不影响数据的逻辑结构。例如,为了提高数据的存取效率,数据库 设计人员重新组织数据的物理组织,这种改变由于内模式与概念模式的存在,而使得数据的概念模 式不会受到影响,也不需要修改应用程序。 概念模式到外模式的映像提供了数据的逻辑独立性,即当数据的整体逻辑结构发生变化时,如 为原有记录增加新的数据项、在概念模式中增加新的数据类型、增加新的数据库记录等,都不影响 外模式。例如,在采购系统中,因为产品结构的变化,采购的零部件需要增、删、修改、更新等, 根据新的数据需求修改数据库之后,并不引起应用程序的变化。 数据库的三级模式,提供了高度的数据独立性。其中,数据库的全局逻辑描述是独立于其他所 有结构描述的,在定义数据库结构时,应该首先定义概念模式。内模式则是将概念模式中所定义的 数据进行适当的组织并加以存储,以实现较好的时空效率。 总之,数据库的三级模式是数据库管理的结构框架,依照这些数据框架组织的数据才是数据库 内容。在数据库设计时,主要是定义数据库的三级模式,而在用户使用数据库时,关心的是数据库 的内容。数据库的模式通常是稳定的,而数据库的数据通常是经常变化的,特别是来自企业业务流 程的数据,数据始终处于动态变化之中。 第 6 页 共 19 页
肖好经份餐多大是 管理信息系统 3.1.4数据库管理系统(DBMS)的功能及其工作过程 1.数据库管理系统的主要功能 (1)数据库的定义功能 DBMS提供数据描述语言(DDL),定义数据库的外模式、概念模式、内模式、数据的完整性约 束和用户的权限等。例如Oracle的数据库管理系统提供DDL,定义Oracle数据库的表、视图、索引 等各种对象。DBMS把用DDL写的各种源模式翻译成内部模式,放在数据字典中,作为管理和存取 数据的依据。例如DBMS可把应用的查询请求从外模式,通过模式转化到物理记录,查询出结果返 回给应用。 (2)数据操纵功能 DBMS提供的数据操纵语言(Data Manipulation Language,DML)可实现对数据的插入、删除 和修改等操作。DML语言有两种用法:一种方法是把DML语句嵌入到高级语言中,另一种方法是 交互式地使用DML语句。对于第一种方法,DBMS必须提供预编译程序,预处理嵌入DML语句的 源程序,识别DML语句,转换为相应高级语言能调用的语句,以便原来的编译程序能接受和处理它 们。 (3)数据库的控制功能 数据库的控制功能包括并发控制、数据的安全性控制、数据的完备性控制和权限控制,保证数 据库系统的正确有效运行。 (4)数据库的维护功能 已经建立好的数据库,在运行过程中需要进行维护。维护功能包括数据库出现故障后的恢复、 数据库的重组、性能的监视等。这些功能大部分由实用程序来完成。 (5)数据字典 数据字典(Data Dictionary,DD)中存放着数据库体系结构的描述。对于应用的操作,DBMS 都要通过查阅数据字典进行。例如Oracle数据库系统,其数据字典中存放着用户建立的表和索引、 系统建立的表和索引以及用于恢复数据库的信息等。当增加表、删除表或修改表的内容时,DBMS 自动更新数据字典;当应用检索数据时,Oracle的DBMS动态地将数据字典与用户程序或终端操作 连起来,保持系统正确地运行。Access数据库管理系统动态地提供了对象浏览器,将数据字典以对 象的形式同其他数据库对象一起进行管理。 2.数据库管理系统的工作过程 一个数据库系统的建立是按模式和存储模式描述的框架,将原始数据存储到设备介质上形成的。 用户可以通过应用程序或查询语言实现对数据的操作。 下面我们以应用程序读取一个记录为例讨论一下DBMS的工作过程,以了解DBMS与应用程序、 操作系统的接口以及三级模式的使用,如图3-10所示。 第7页共19页
管理信息系统 3.1.4 数据库管理系统(DBMS)的功能及其工作过程 1.数据库管理系统的主要功能 (1) 数据库的定义功能 DBMS 提供数据描述语言(DDL),定义数据库的外模式、概念模式、内模式、数据的完整性约 束和用户的权限等。例如 Oracle 的数据库管理系统提供 DDL,定义 Oracle 数据库的表、视图、索引 等各种对象。DBMS 把用 DDL 写的各种源模式翻译成内部模式,放在数据字典中,作为管理和存取 数据的依据。例如 DBMS 可把应用的查询请求从外模式,通过模式转化到物理记录,查询出结果返 回给应用。 (2) 数据操纵功能 DBMS 提供的数据操纵语言(Data Manipulation Language,DML)可实现对数据的插入、删除 和修改等操作。DML 语言有两种用法:一种方法是把 DML 语句嵌入到高级语言中,另一种方法是 交互式地使用 DML 语句。对于第一种方法,DBMS 必须提供预编译程序,预处理嵌入 DML 语句的 源程序,识别 DML 语句,转换为相应高级语言能调用的语句,以便原来的编译程序能接受和处理它 们。 (3) 数据库的控制功能 数据库的控制功能包括并发控制、数据的安全性控制、数据的完备性控制和权限控制,保证数 据库系统的正确有效运行。 (4) 数据库的维护功能 已经建立好的数据库,在运行过程中需要进行维护。维护功能包括数据库出现故障后的恢复、 数据库的重组、性能的监视等。这些功能大部分由实用程序来完成。 (5) 数据字典 数据字典(Data Dictionary,DD)中存放着数据库体系结构的描述。对于应用的操作,DBMS 都要通过查阅数据字典进行。例如 Oracle 数据库系统,其数据字典中存放着用户建立的表和索引、 系统建立的表和索引以及用于恢复数据库的信息等。当增加表、删除表或修改表的内容时,DBMS 自动更新数据字典;当应用检索数据时,Oracle 的 DBMS 动态地将数据字典与用户程序或终端操作 连起来,保持系统正确地运行。Access 数据库管理系统动态地提供了对象浏览器,将数据字典以对 象的形式同其他数据库对象一起进行管理。 2.数据库管理系统的工作过程 一个数据库系统的建立是按模式和存储模式描述的框架,将原始数据存储到设备介质上形成的。 用户可以通过应用程序或查询语言实现对数据的操作。 下面我们以应用程序读取一个记录为例讨论一下 DBMS 的工作过程,以了解 DBMS 与应用程序、 操作系统的接口以及三级模式的使用,如图 3-10 所示。 第 7 页 共 19 页
莲喇4桂降发事六是 管理信息系统 子模式 概念模式 存储模式 2 3 应用程序A DBMS 工作区 通讯单元 9 OS 6 7 数据库 结果缓冲区 图3-10DBMS工作过程示意图 ·应用程序A通过DML命令向DBMS发出读请求,并提供读取记录参数,如记录号、关键字等。 ●DBMS根据应用程序A对应的子模式中的信息,检查用户权限,决定是否接受读请求。 ● 如果是合法用户,则调用模式,根据模式与子模式间数据的对应关系,确定需要读取的逻辑数 据记录。 ● DBMS根据存储模式,确定需要读取得物理记录。 ●DBMS向操作系统发读取记录的命令。 ·操作系统执行该命令,控制存储设备读出记录数据。 ●在操作系统控制下,将读出的记录送入系统缓冲区。 DBMS比较模式与子模式,从系统缓冲区中得到所需的逻辑记录,并经过必要的数据变换后, 将数据送入用户工作区。 DBMS向应用程序发送读命令执行情况的状态信息。 应用程序对读取的数据进行相应处理。 3.数据库系统的不同视图 数据库系统的管理、开发和使用人员主要有数据库管理员、系统分析员、应用程序员和用户。 这些人员的职责和作用是不同的,因而涉及到不同的数据抽象级别,分别对应于不同的数据视图。 如图3-11所示。 外模式 用户 应用系统 应用程序员 概念模式 DBMS 数据库管理员 存储模式 与系统分析员 oS DB 第8页共19页
管理信息系统 DBMS 子模式 概念模式 应用程序 A 工作区 通讯单元 9 5 2 3 4 1 6 7 数据库 结果缓冲区 OS 存储模式 图 3-10 DBMS 工作过程示意图 z 应用程序 A 通过 DML 命令向 DBMS 发出读请求,并提供读取记录参数,如记录号、关键字等。 z DBMS 根据应用程序 A 对应的子模式中的信息,检查用户权限,决定是否接受读请求。 z 如果是合法用户,则调用模式,根据模式与子模式间数据的对应关系,确定需要读取的逻辑数 据记录。 z DBMS 根据存储模式,确定需要读取得物理记录。 z DBMS 向操作系统发读取记录的命令。 z 操作系统执行该命令,控制存储设备读出记录数据。 z 在操作系统控制下,将读出的记录送入系统缓冲区。 z DBMS 比较模式与子模式,从系统缓冲区中得到所需的逻辑记录,并经过必要的数据变换后, 将数据送入用户工作区。 z DBMS 向应用程序发送读命令执行情况的状态信息。 z 应用程序对读取的数据进行相应处理。 3.数据库系统的不同视图 数据库系统的管理、开发和使用人员主要有数据库管理员、系统分析员、应用程序员和用户。 这些人员的职责和作用是不同的,因而涉及到不同的数据抽象级别,分别对应于不同的数据视图。 如图 3-11 所示。 DBMS OS DB 存储模式 概念模式 外模式 应用系统 用户 应用程序员 数据库管理员 与系统分析员 第 8 页 共 19 页
渊好煙份贺多大是 管理信息系统 图3-11数据库系统的不同视图 (1)用户 用户分为应用程序和最终用户两类(End User),他们通过数据库系统提供的接口和开发工具软 件使用数据库。目前常用的接口方式有菜单驱动、表格操作、利用数据库与高级语言的接口编程、 生成报表等。这些接口给用户带来很大方便。 (2)应用程序员 应用程序员负责涉及应用系统的的程序接口,编写应用程序通过数据库管理员为他建立的外模 式来操纵数据库中的数据。 (3)系统分析员 系统程序员负责应用系统的需求分析和规范说明。系统分析员要与用户和数据库管理员配合好, 确定系统的软硬件配置,共同做好数据库各级模式的概要设计。 (4)数据库管理员 数据库管理员(DataBase Administrater,DBA)可以是一个人,也可以是由几个人组成的小组。 他们全面负责管理、维护和控制数据库系统,一般来说由业务水平较高和资历较深的人员担任。 他们的主要工作包括: 决定数据库的信息内容。数据库中存放什么信息是由DBA决定的。他们确定应用程序的实体, 完成数据库模式的设计,并同应用程序员一起完成用户子模式的设计工作。 决定数据库的存储结构和存取策略。确定数据的物理组织、存放方式及数据存取方法。 定义存取权限和有效性检验。用户对数据库的存取权限、数据的保密级别和数据的约束条件都 是由DBA确定的。 建立数据库。DBA负责原始数据的装入,建立用户数据库。 监督数据库的运行。DBA负责监视数据库的正常运行,当出现软硬件故障时,能及时排除,使 数据库恢复到正常状态,并负责数据库的定期转储和日志文件的维护等工作。 重组和改进数据库。DBA通过各种日志和统计数字分析系统性能。当系统性能下降时,对数据 库进行重新组织,同时根据用户的使用情况,不断改进数据库的设计,以提高系统性能,满足用户 需要。 3.2数据仓库和数据挖掘 数据仓库是信息技术领域和企业界最新最热门的流行词汇和概念之一。提高顾客满意度,不断 增加市场份额和利润,增强企业的市场竞争力等,所有战略性并与企业历史信息相关的重大决策都 需要数据仓库技术的支持。数据仓库是信息的逻辑集合,这些信息来自许多不同的业务数据库,并 用于支持企业的分析活动和决策任务,或者说,数据仓库代表了一种对企业中的信息进行组织和管 理的与以往不同的思维方式。 3.2.1数据仓库的概念 目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集 第9页共19页
管理信息系统 图 3-11 数据库系统的不同视图 (1) 用户 用户分为应用程序和最终用户两类(End User),他们通过数据库系统提供的接口和开发工具软 件使用数据库。目前常用的接口方式有菜单驱动、表格操作、利用数据库与高级语言的接口编程、 生成报表等。这些接口给用户带来很大方便。 (2) 应用程序员 应用程序员负责涉及应用系统的的程序接口,编写应用程序通过数据库管理员为他建立的外模 式来操纵数据库中的数据。 (3) 系统分析员 系统程序员负责应用系统的需求分析和规范说明。系统分析员要与用户和数据库管理员配合好, 确定系统的软硬件配置,共同做好数据库各级模式的概要设计。 (4) 数据库管理员 数据库管理员(DataBase Administrater,DBA)可以是一个人,也可以是由几个人组成的小组。 他们全面负责管理、维护和控制数据库系统,一般来说由业务水平较高和资历较深的人员担任。 他们的主要工作包括: 决定数据库的信息内容。数据库中存放什么信息是由 DBA 决定的。他们确定应用程序的实体, 完成数据库模式的设计,并同应用程序员一起完成用户子模式的设计工作。 决定数据库的存储结构和存取策略。确定数据的物理组织、存放方式及数据存取方法。 定义存取权限和有效性检验。用户对数据库的存取权限、数据的保密级别和数据的约束条件都 是由 DBA 确定的。 建立数据库。DBA 负责原始数据的装入,建立用户数据库。 监督数据库的运行。DBA 负责监视数据库的正常运行,当出现软硬件故障时,能及时排除,使 数据库恢复到正常状态,并负责数据库的定期转储和日志文件的维护等工作。 重组和改进数据库。DBA 通过各种日志和统计数字分析系统性能。当系统性能下降时,对数据 库进行重新组织,同时根据用户的使用情况,不断改进数据库的设计,以提高系统性能,满足用户 需要。 3.2 数据仓库和数据挖掘 数据仓库是信息技术领域和企业界最新最热门的流行词汇和概念之一。提高顾客满意度,不断 增加市场份额和利润,增强企业的市场竞争力等,所有战略性并与企业历史信息相关的重大决策都 需要数据仓库技术的支持。数据仓库是信息的逻辑集合,这些信息来自许多不同的业务数据库,并 用于支持企业的分析活动和决策任务,或者说,数据仓库代表了一种对企业中的信息进行组织和管 理的与以往不同的思维方式。 3.2.1 数据仓库的概念 目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家 W.H.Inmon 在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集 第 9 页 共 19 页
链喇头舍贸多六是 管理信息系统 合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于 支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库:其次,数据仓库是对多个异 构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数 据一般不再修改。 根据数据仓库概念的含义,数据仓库拥有以下四个特点: 1.面向主题 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数 据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关 心的重点方面,一个主题通常与多个操作型信息系统相关。 2.集成的 面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是 异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇 总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致 的全局信息。 3.相对稳定的 操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企 业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况 下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要 定期的加载、刷新。 4.反映历史变化 操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息, 系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信 息,可以对企业的发展历程和未来趋势做出定量分析和预测。 企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据 仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其 业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组, 并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看, 数据仓库建设是一个工程,是一个过程。 3.2.2为什么需要数据仓库 商业活动的复杂性以及顾客对企业响应速度越来越苛刻的需求,改变了企业的经营 方式。企业经理人员不仅要了解市场发生的事情,还要知道为什么会发生这些事情。而 为了回答“为什么会发生”,数据仓库技术可以起到关键作用。数据仓库在综合各种业务 数据的基础上,以多维数据库和数据挖掘为工具,提供智能查询和大量的总结报告。 1.管理中的问题 新世纪商业环境的一大特征是外部力量加剧了市场竞争,企业必须寻求市场差异性,或者支持 更快的响应速度。企业的历史数据是一种极其重要的信息,它与顾客、顾客产品关系、顾客购买模 式等有关。数据仓库具有将信息转换成知识的潜在能力,顾客的深层次信息可以潜在地传送给经理。 图3-12所示的模型说明了数据仓库在顾客分类和市场竞争方面的应用。 第10页共19页
管理信息系统 合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于 支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异 构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数 据一般不再修改。 根据数据仓库概念的含义,数据仓库拥有以下四个特点: 1.面向主题 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数 据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关 心的重点方面,一个主题通常与多个操作型信息系统相关。 2.集成的 面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是 异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇 总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致 的全局信息。 3.相对稳定的 操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企 业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况 下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要 定期的加载、刷新。 4.反映历史变化 操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息, 系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信 息,可以对企业的发展历程和未来趋势做出定量分析和预测。 企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据 仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其 业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组, 并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看, 数据仓库建设是一个工程,是一个过程。 3.2.2 为什么需要数据仓库 商业活动的复杂性以及顾客对企业响应速度越来越苛刻的需求,改变了企业的经营 方式。企业经理人员不仅要了解市场发生的事情,还要知道为什么会发生这些事情。而 为了回答“为什么会发生”,数据仓库技术可以起到关键作用。数据仓库在综合各种业务 数据的基础上,以多维数据库和数据挖掘为工具,提供智能查询和大量的总结报告。 1.管理中的问题 新世纪商业环境的一大特征是外部力量加剧了市场竞争,企业必须寻求市场差异性,或者支持 更快的响应速度。企业的历史数据是一种极其重要的信息,它与顾客、顾客/产品关系、顾客购买模 式等有关。数据仓库具有将信息转换成知识的潜在能力,顾客的深层次信息可以潜在地传送给经理。 图 3-12 所示的模型说明了数据仓库在顾客分类和市场竞争方面的应用。 第 10 页 共 19 页