第13章数据仓库技术 数据仓库是数据库技术的另一重要发展方向。 人们希望能更多地通过数据库系统获得决策支持 信息的推动下发展起来的一项新数据库技术 ■本章主要介绍操作性处理与分析型处理的区别, 联杋事务处理(OLTP)和联机分析处理(OLAP) 的不同,数据仓库技术的基本概念、组成结构 技术特征、设计,数据挖掘和决策支持系统 (DSS),以及 SQL Server的DBMS对数据仓库 的支持
第13章 数据仓库技术 ◼ 数据仓库是数据库技术的另一重要发展方向。 ◼ 人们希望能更多地通过数据库系统获得决策支持 信息的推动下发展起来的一项新数据库技术。 ◼ 本章主要介绍操作性处理与分析型处理的区别, 联机事务处理(OLTP)和联机分析处理(OLAP) 的不同,数据仓库技术的基本概念、组成结构、 技术特征、设计,数据挖掘和决策支持系统 (DSS),以及SQL Server的DBMS对数据仓库 的支持
第13章数据仓库技术 13,1从数据库到数据合库 132数据仓库的结构 133数据仓库的设计 134OLAP与数据合库 35数据挖掘( data mining,DM 13.6决策支持系统与数据仓库 137 SQL Server2000的数据仓库 138小结 139习题
第13章 数据仓库技术 ◼ 13.1 从数据库到数据仓库 ◼ 13.2 数据仓库的结构 ◼ 13.3 数据仓库的设计 ◼ 13.4 OLAP与数据仓库 ◼ 13.5 数据挖掘(data mining,DM) ◼ 13.6 决策支持系统与数据仓库 ◼ 13.7 SQL Server 2000的数据仓库 ◼ 13.8 小结 ◼ 13.9 习题
13.1从数据库到数据仓库 13.1.1操作型处理和分析型处理 ■13.1.2从数据库到数据仓库 13.1.3操作型数据和分析型数据
13.1 从数据库到数据仓库 ◼ 13.1.1 操作型处理和分析型处理 ◼ 13.1.2 从数据库到数据仓库 ◼ 13.1.3 操作型数据和分析型数据
3.1.1操作型处理和分析型处理 操作型处理 分析型处理 性能特性不同存取操作频率高,每次操作有时需要连续运行几个小时, 时间短,要求较短响应时间,从而消耗大量的系统资源 可按分时方式 集成性问题 般只需与本部门有关的当迫切需要集成数据、企业内部、 前数据,集成性要求较少。外部和竞争对手等信息。 数据动态集成不要动态集成。 需一定周期进行动态集成 性问题 历史数据问题一般只需当前数据,数据库需要分析大量历史数据 中只保存短期数据 综合数据问题积累了大量的细节性数据,不分析细节性数据,而要进行 但很少对数据进行综 不同程度综合,分析综合信息 用户数量 相对较少
13.1.1 操作型处理和分析型处理 操作型处理 分析型处理 性能特性不同 存取操作频率高,每次操作 时间短,要求较短响应时间, 可按分时方式。 有时需要连续运行几个小时, 从而消耗大量的系统资源。 集成性问题 一般只需与本部门有关的当 前数据,集成性要求较少。 迫切需要集成数据、企业内部、 外部和竞争对手等信息。 数据动态集成 性问题 不要动态集成。 需一定周期进行动态集成。 历史数据问题 一般只需当前数据,数据库 中只保存短期数据。 需要分析大量历史数据。 综合数据问题 积累了大量的细节性数据, 但很少对数据进行综合。 不分析细节性数据,而要进行 不同程度综合,分析综合信息。 用户数量 多 相对较少
13.1.2从数据库到数据仓库 ■产生的根本原因是对决策信息的迫切需求 ■20世纪90年代以来,在操作型数据环境中建立 DSS效果不理想 对传统数据库反思。??? ■在规划设计的基础上,对数据库中的数据按照不 同的主题归纳、统计、汇总、集成,使其长期保 存在计算机中,并随着时间推移不断追加,这样 形成的数据集合便是我们所说的数据仓库
13.1.2 从数据库到数据仓库 ◼ 产生的根本原因是对决策信息的迫切需求。 ◼ 20世纪90年代以来,在操作型数据环境中建立 DSS效果不理想。 ◼ 对传统数据库反思。??? ◼ 在规划设计的基础上,对数据库中的数据按照不 同的主题归纳、统计、汇总、集成,使其长期保 存在计算机中,并随着时间推移不断追加,这样 形成的数据集合便是我们所说的数据仓库
13.1.3操作型数据和分析型数据 原始数据操作型数据 导出数据/分析型数据 细节的 综合的或提炼的 在存取瞬间是准确的 代表过去的历史数据 可更新 很少更新 操作需求事先可知道 操作需要事先不知道 生命周期符合SDLC 完全不同的生命周期 对性能要求高 对性能要求宽松 事务驱动 分析驱动 面向业务应用 面向分析 次操作小量数据 次操作大量数据 支持日常操作 支持管理决策需求
13.1.3 操作型数据和分析型数据 原始数据/操作型数据 导出数据/分析型数据 细节的 综合的或提炼的 在存取瞬间是准确的 代表过去的历史数据 可更新 很少更新 操作需求事先可知道 操作需要事先不知道 生命周期符合SDLC 完全不同的生命周期 对性能要求高 对性能要求宽松 事务驱动 分析驱动 面向业务应用 面向分析 一次操作小量数据 一次操作大量数据 支持日常操作 支持管理决策需求
13.2数据仓库的结构 数据仓库是一个不同于传统数据库的数据集合 它是对传统数据库进行抽取、归纳、统计、汇 总集成而成。 ■13.2.1数据仓库的概念及特点 132.2数据仓库的组成结构 ■1323数据仓库的数据组织 1324数据仓库需要的数据库技术
13.2 数据仓库的结构 ◼ 数据仓库是一个不同于传统数据库的数据集合, 它是对传统数据库进行抽取、归纳、统计、汇 总集成而成。 ◼ 13.2.1 数据仓库的概念及特点 ◼ 13.2.2 数据仓库的组成结构 ◼ 13.2.3 数据仓库的数据组织 ◼ 13.2.4 数据仓库需要的数据库技术
13.2.1数据仓库的概念及特点 ■数据仓库是一种高级、复杂的数据库技术。完 整的数据仓库理论包括三个方面:数据仓库技 术、联机分析处理(OLAP)、数据挖掘(DM)。 数据仓库是一个面向主题的、集成的、稳定的 随时间而变的数据集合,用以支持经营管理过 程中的决策制订过程 ■数据仓库四特征:面向主题、集成、稳定和随 时间变化
13.2.1 数据仓库的概念及特点 ◼ 数据仓库是一种高级、复杂的数据库技术。完 整的数据仓库理论包括三个方面:数据仓库技 术、联机分析处理(OLAP)、数据挖掘(DM)。 ◼ 数据仓库是一个面向主题的、集成的、稳定的、 随时间而变的数据集合,用以支持经营管理过 程中的决策制订过程。 ◼ 数据仓库四特征:面向主题、集成、稳定和随 时间变化
13.2.2数据仓库的组成结构 ■从构成元素上看,数据仓库由物理元素和功能 元素的组成,包括数据源、关系数据库、数据 集市、维度、级别、度量值、单元、多维数据 集、分区和聚合等。 ■数据仓库系统总体组成结构一般包含7个部分: 数据源部分、数据抽取转换和装载工具、数据 建模工具、数据仓储、数据仓库的目标数据 数据仓库管理工具、前端数据访问分析工具
13.2.2 数据仓库的组成结构 ◼ 从构成元素上看,数据仓库由物理元素和功能 元素的组成,包括数据源、关系数据库、数据 集市、维度、级别、度量值、单元、多维数据 集、分区和聚合等。 ◼ 数据仓库系统总体组成结构一般包含7个部分: 数据源部分、数据抽取转换和装载工具、数据 建模工具、数据仓储、数据仓库的目标数据、 数据仓库管理工具、前端数据访问分析工具
13.2.2数据仓库的总体组成结构图 数据仓库 用户查询 管理工具 关系性DBMS 工具 关系数据库 抽取、转换 C/S 数据文件 、装载 专用多维DBMS 工具 管理工具 其他 元数据仓库 OLAP 综合数据 工具 数据建摸 当前数据 工具 DM工具 历史数据 数据源 数据抽取和转换数据仓库目标数据库数据访问分析工具
13.2.2数据仓库的总体组成结构图 关系数据库 数据文件 其他 数据仓库 管理工具 元数据仓库 数据建摸 工具 OLAP 工具 C/S 工具 用户查询 工具 抽取、转换 、装载 管理工具 历史数据 当前数据 综合数据 DM工具 数据源 数据抽取和转换 数据仓库目标数据库 数据访问分析工具 关系性DBMS 专用多维DBMS