数据库设计规范指南 数据库设计(Database Design)是指对于一个给定的应用环境,构造最优的数据库模 式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息 要求和处理要求)。 在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。 一、数据库和信息系统 (1)数据库是信息系统的核心和基础,把信息系统中大量的数据按一定的模型组织起来,提 供存储、维护、检索数据的功能,使信息系统可以方便、及时、准确地从数据库中获得所需 的信息。 (2)数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在。 (③)数据库设计是信息系统开发和建设的重要组成部分。 (4)数据库设计人员应该具备的技术和知识: a.数据库的基本知识和数据库设计技术; b.计算机科学的基础知识和程序设计的方法和技巧; c.软件工程的原理和方法; d应用领域的知识; 二、数据库设计的特点 数据库建设是硬件、软件和干件的结合,三分技术,七分管理,十二分基础数据,技术 与管理的界面称之为“干件”。 数据库设计应该与应用系统设计相结合: 结构(数据)设计:设计数据库框架或数据库结构: 行为(处理)设计:设计应用程序、事务处理等: 结构和行为分离的设计:传统的软件工程忽视对应用中数据语义的分析和抽象,只要有 可能就尽量推迟数据结构设计的决策早期的数据库设计致力于数据模型和建模方法研究,忽 视了对行为的设计 如图:
数据库设计规范指南 数据库设计(Database Design)是指对于一个给定的应用环境,构造最优的数据库模 式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息 要求和处理要求)。 在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。 一、数据库和信息系统 (1)数据库是信息系统的核心和基础,把信息系统中大量的数据按一定的模型组织起来,提 供存储、维护、检索数据的功能,使信息系统可以方便、及时、准确地从数据库中获得所需 的信息。 (2)数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在。 (3)数据库设计是信息系统开发和建设的重要组成部分。 (4)数据库设计人员应该具备的技术和知识: a.数据库的基本知识和数据库设计技术; b. 计算机科学的基础知识和程序设计的方法和技巧; c.软件工程的原理和方法; d.应用领域的知识; 二、数据库设计的特点 数据库建设是硬件、软件和干件的结合,三分技术,七分管理,十二分基础数据,技术 与管理的界面称之为“干件”。 数据库设计应该与应用系统设计相结合: 结构(数据)设计:设计数据库框架或数据库结构; 行为(处理)设计:设计应用程序、事务处理等; 结构和行为分离的设计:传统的软件工程忽视对应用中数据语义的分析和抽象,只要有 可能就尽量推迟数据结构设计的决策早期的数据库设计致力于数据模型和建模方法研究,忽 视了对行为的设计 如图:
现实世界 数斯分析 功能分历 概念桢型设计 功德核型 功能说明 逻辑数据库设计 事务设计 物理数据军议计 程序说明 子横武设计 应用程序设计 建立数X再 程序需码调试 三、数据库设计方法简述 手工试凑法 设计质量与设计人员的经验和水平有直接关系 缺乏科学理论和工程方法的支持,工程的质量难以保证 数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价 规范设计法 手工设计方 基本思想 过程迭代和逐步求精 规范设计法(续) 典型方法: (I)新奥尔良(New Orleans)方法:将数据库设计分为四个阶段 S.B.Yao方法:将数据库设计分为五个步骤 I.R.Palmer方法:把数据库设计当成一步接一步的过程 (2)计算机辅助设计 ORACLE Designer 2000 SYBASE PowerDesigner 四、数据库设计的基本步骤 数据库设计的过程(六个阶段) 1.需求分析阶段
三、数据库设计方法简述 手工试凑法 设计质量与设计人员的经验和水平有直接关系 缺乏科学理论和工程方法的支持,工程的质量难以保证 数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价 规范设计法 手工设计方 基本思想 过程迭代和逐步求精 规范设计法(续) 典型方法: (1)新奥尔良(New Orleans)方法:将数据库设计分为四个阶段 S.B.Yao 方法:将数据库设计分为五个步骤 I.R.Palmer 方法:把数据库设计当成一步接一步的过程 (2)计算机辅助设计 ORACLE Designer 2000 SYBASE PowerDesigner 四、数据库设计的基本步骤 数据库设计的过程(六个阶段) 1.需求分析阶段
准确了解与分析用户需求(包括数据与处理) 是整个设计过程的基础,是最困难、最耗费时间的一步 2.概念结构设计阶段 是整个数据库设计的关键 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型 3.逻辑结构设计阶段 将概念结构转换为某个DBMS所支持的数据模型 对其进行优化 4.数据库物理设计阶段 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法) 5.数据库实施阶段 运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果 建立数据库,编制与调试应用程序,组织数据入库,并进行试运行 6.数据库运行和维护阶段 数据库应用系统经过试运行后即可投入正式运行。 在数据库系统运行过程中必须不断地对其进行评价、调整与修改 设计特点: 在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来将这两个 方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两 方面的设计 设计过程各个阶段的设计描述: 如图P> 技 设请输运 数据 处理 泰清 华华. 餐会模型(影民居) 数据字肉 看蜜相 非关系 资货您品 租 天 性能监商,转锌钱复 数粼库重铜和重构 2头、博护《n.通
准确了解与分析用户需求(包括数据与处理) 是整个设计过程的基础,是最困难、最耗费时间的一步 2.概念结构设计阶段 是整个数据库设计的关键 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体 DBMS 的概念模型 3.逻辑结构设计阶段 将概念结构转换为某个 DBMS 所支持的数据模型 对其进行优化 4.数据库物理设计阶段 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法) 5.数据库实施阶段 运用 DBMS 提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果 建立数据库,编制与调试应用程序,组织数据入库,并进行试运行 6.数据库运行和维护阶段 数据库应用系统经过试运行后即可投入正式运行。 在数据库系统运行过程中必须不断地对其进行评价、调整与修改 设计特点: 在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来将这两个 方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两 方面的设计 设计过程各个阶段的设计描述: 如图 P>
五、数据库各级模式的形成过程 1.需求分析阶段:综合各个用户的应用需求 2.概念设计阶段:形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图) 3.逻辑设计阶段:首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模 型,形成数据库逻辑模式:然后根据用户处理的要求、安全性的考虑,在基本表的基础上再 建立必要的视图(View),形成数据的外模式 4.物理设计阶段:根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形 成数据库内模式 六、数据库设计原则 1.设计数据库之前(需求分析阶段) 1)理解客户需求,询问用户如何看待未来需求变化。让客户解释其需求,而且随着开 发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。 2)了解企业业务可以在以后的开发阶段节约大量的时间。 3)重视输入输出。 在定义数据库表和字段需求(输入)时,首先应检查现有的或 者已经设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。 举例:假如客户需要一个报表按照邮政编码排序、分段和求和,你要保证其中包括了单 独的邮政编码字段而不要把邮政编码糅进地址字段里。 4)创建数据字典和ER图表 ER图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER 图对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别 名。对SQL表达式的文档化来说这是完全必要的。 5)定义标准的对象命名规范 数据库各种对象的命名必须规范。 2.表和字段的设计(数据库逻辑设计) 表设计原则 1)标准化和规范化 数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但Thid Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简 单来说,遵守3NF标准的数据库的表设计原则是:“One Fact in One Place”即某个表 只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过 外键相连接。它具有以下特点:有一组表专门存放通过键连接起来的关联数据。 举例:
五、数据库各级模式的形成过程 1.需求分析阶段:综合各个用户的应用需求 2.概念设计阶段:形成独立于机器特点,独立于各个 DBMS 产品的概念模式(E-R 图) 3.逻辑设计阶段:首先将 E-R 图转换成具体的数据库产品支持的数据模型,如关系模 型,形成数据库逻辑模式;然后根据用户处理的要求、安全性的考虑,在基本表的基础上再 建立必要的视图(View),形成数据的外模式 4.物理设计阶段:根据 DBMS 特点和处理的需要,进行物理存储安排,建立索引,形 成数据库内模式 六、数据库设计原则 1. 设计数据库之前(需求分析阶段) 1) 理解客户需求,询问用户如何看待未来需求变化。让客户解释其需求,而且随着开 发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。 2) 了解企业业务可以在以后的开发阶段节约大量的时间。 3) 重视输入输出。 在定义数据库表和字段需求(输入)时,首先应检查现有的或 者已经设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。 举例:假如客户需要一个报表按照邮政编码排序、分段和求和,你要保证其中包括了单 独的邮政编码字段而不要把邮政编码糅进地址字段里。 4) 创建数据字典和 ER 图表 ER 图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER 图对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别 名。对 SQL 表达式的文档化来说这是完全必要的。 5) 定义标准的对象命名规范 数据库各种对象的命名必须规范。 2. 表和字段的设计(数据库逻辑设计) 表设计原则 1) 标准化和规范化 数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但 Third Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简 单来说,遵守 3NF 标准的数据库的表设计原则是:“One Fact in One Place”即某个表 只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过 外键相连接。它具有以下特点:有一组表专门存放通过键连接起来的关联数据。 举例:
某个存放客户及其有关定单的3NF数据库就可能有两个表:Customer和Order。Order 表不包含定单关联客户的任何信息,但表内会存放一个键值,该键指向Customer表里包 含该客户信息的那一行。 事实上,为了效率的缘故,对表不进行标准化有时也是必要的。 2)数据驱动 采用数据驱动而非硬编码的方式,许多策略变更和维护都会方便得多,大大增强系统的 灵活性和扩展性。举例,假如用户界面要访问外部数据源(文件、XML文档、其他数 据库等),不妨把相应的连接和路径信息存储在用户界面支持表里。还有,如果用户界面执 行工作流之类的任务(发送邮件、打印信笺、修改记录状态等),那么产生工作流的数据也 可以存放在数据库里。角色权限管理也可以通过数据驱动来完成。事实上,如果过程是数据 驱动的,你就可以把相当大的责任推给用户,由用户来维护自己的工作流过程。 3)考 虑各种变化 在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。举例,姓氏就是如 此(注意是西方人的姓氏,比如女性结婚后从夫姓等)。所以,在建立系统存储客户信息时, 在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止日等字段,这样就可以跟踪 这一数据条目的变化。 字段设计原则 4)每个表中都应该添加的3个有用的字段 dRecordCreationDate,在VB下默认是Now(),而在SQL Server下默认为 GETDATE()sRecordCreator,在SQL Server下默认为NOT NULL DEFAULTUSERnRecordVersion,记录的版本标记:有助于准确说明记录中出现null数 据或者丢失数据的原因。 5)对地址和电话采用多个字段 描述街道地址就短短一行记录是不够的。Address._Line1、Address_.Line2和 Address_Line3可以提供更大的灵活性。还有,电话号码和邮件地址最好拥有自己的数据 表,其间具有自身的类型和标记类别。 6)使用角色实体定义属于某类别的列 在需要对属于特定类别或者具有特定角色的事物做定义时,可以用角色实体来创建特定 的时间关联关系,从而可以实现自我文档化。 举例:用PERSON实体和PERSON_TYPE实体来描述人员。比方说,当John Smith, Engineer提升为John Smith,Director乃至最后爬到John Smith,CIO的高位,而所 有你要做的不过是改变两个表PERSON和PERSON_TYPE之间关系的键值,同时增加一 个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE表就包含了所有 PERSON的可能类型,比如Associate、Engineer、.Director、CIO或者CEO等。还
某个存放客户及其有关定单的 3NF 数据库就可能有两个表:Customer 和 Order。Order 表不包含定单关联客户的任何信息,但表内会存放一个键值,该键指向 Customer 表里包 含该客户信息的那一行。 事实上,为了效率的缘故,对表不进行标准化有时也是必要的。 2) 数据驱动 采用数据驱动而非硬编码的方式,许多策略变更和维护都会方便得多,大大增强系统的 灵活性和扩展性。 举例,假如用户界面要访问外部数据源(文件、XML 文档、其他数 据库等),不妨把相应的连接和路径信息存储在用户界面支持表里。还有,如果用户界面执 行工作流之类的任务(发送邮件、打印信笺、修改记录状态等),那么产生工作流的数据也 可以存放在数据库里。角色权限管理也可以通过数据驱动来完成。事实上,如果过程是数据 驱动的,你就可以把相当大的责任推给用户,由用户来维护自己的工作流过程。 3) 考 虑各种变化 在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。 举例,姓氏就是如 此(注意是西方人的姓氏,比如女性结婚后从夫姓等)。所以,在建立系统存储客户信息时, 在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止日等字段,这样就可以跟踪 这一数据条目的变化。 字段设计原则 4) 每个表中都应该添加的 3 个有用的字段 dRecordCreationDate,在 VB 下默认是 Now(),而在 SQL Server 下默认为 GETDATE() sRecordCreator , 在 SQL Server 下默认为 NOT NULL DEFAULTUSERnRecordVersion,记录的版本标记;有助于准确说明记录中出现 null 数 据或者丢失数据的原因 。 5) 对地址和电话采用多个字段 描述街道地址就短短一行记录是不够的。Address_Line1、Address_Line2 和 Address_Line3 可以提供更大的灵活性。还有,电话号码和邮件地址最好拥有自己的数据 表,其间具有自身的类型和标记类别。 6) 使用角色实体定义属于某类别的列 在需要对属于特定类别或者具有特定角色的事物做定义时,可以用角色实体来创建特定 的时间关联关系,从而可以实现自我文档化。 举例:用 PERSON 实体和 PERSON_TYPE 实体来描述人员。比方说,当 John Smith, Engineer 提升为 John Smith, Director 乃至最后爬到 John Smith, CIO 的高位,而所 有你要做的不过是改变两个表 PERSON 和 PERSON_TYPE 之间关系的键值,同时增加一 个日期/时间字段来知道变化是何时发生的。这样,你的 PERSON_TYPE 表就包含了所有 PERSON 的可能类型,比如 Associate、Engineer、Director、CIO 或者 CEO 等。还
有个替代办法就是改变PERSON记录来反映新头衔的变化,不过这样一来在时间上无法跟 踪个人所处位置的具体时间。 7)选择数字类型和文本类型尽量充足 在SQL中使用smallint和tinyint类型要特别小心。比如,假如想看看月销售总额, 总额字段类型是smallint,那么,如果总额超过了$32,767就不能进行计算操作了。 而ID类型的文本字段,比如客户ID或定单号等等都应该设置得比一般想象更大。假 设客户ID为10位数长。那你应该把数据库表字段的长度设为12或者13个字符长。但 这额外占据的空间却无需将来重构整个数据库就可以实现数据库规模的增长了。 8)增加删除标记字段 在表中包含一个“删除标记”字段,这样就可以把行标记为删除。在关系数据库里不要 单独删除某一行:最好采用清除数据程序而且要仔细维护索引整体性。 3.选择键和索引(数据库逻辑设计) 键选择原则: 1)键设计4原则 为关联字段创建外键。 所有的键都必须唯一。 避免使用复合键。 外键总是关联唯一的键字段。 2)使用系统生成的主键 设计数据库的时候采用系统生成的键作为主键,那么实际控制了数据库的索引完整性。 这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。采用系统生成键作 为主键还有一个优点:当拥有一致的键结构时,(不让主键具有可更新性) 在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情 况下不要选择用户可编辑的字段作为键。 4)可选键有时可做主键 把可选键进一步用做主键,可以拥有建立强大索引的能力。 索引使用原则: 索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索 引技术得到解决。 1)逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引, 对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问 是否主要用作读写。 2)大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常
有个替代办法就是改变 PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟 踪个人所处位置的具体时间。 7) 选择数字类型和文本类型尽量充足 在 SQL 中使用 smallint 和 tinyint 类型要特别小心。比如,假如想看看月销售总额, 总额字段类型是 smallint,那么,如果总额超过了$32,767 就不能进行计算操作了。 而 ID 类型的文本字段,比如客户 ID 或定单号等等都应该设置得比一般想象更大。假 设客户 ID 为 10 位数长。那你应该把数据库表字段的长度设为 12 或者 13 个字符长。但 这额外占据的空间却无需将来重构整个数据库就可以实现数据库规模的增长了。 8) 增加删除标记字段 在表中包含一个“删除标记”字段,这样就可以把行标记为删除。在关系数据库里不要 单独删除某一行;最好采用清除数据程序而且要仔细维护索引整体性。 3. 选择键和索引(数据库逻辑设计) 键选择原则: 1) 键设计 4 原则 为关联字段创建外键。 所有的键都必须唯一。 避免使用复合键。 外键总是关联唯一的键字段。 2) 使用系统生成的主键 设计数据库的时候采用系统生成的键作为主键,那么实际控制了数据库的索引完整性。 这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。采用系统生成键作 为主键还有一个优点:当拥有一致的键结构时,(不让主键具有可更新性) 在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情 况下不要选择用户可编辑的字段作为键。 4) 可选键有时可做主键 把可选键进一步用做主键,可以拥有建立强大索引的能力。 索引使用原则: 索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索 引技术得到解决。 1) 逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引, 对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问 是否主要用作读写。 2) 大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常
使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。 3)不要索引memo/note字段,不要索引大型字段(有很多字符),这样作会让索引 占用太多的存储空间。 4)不要索引常用的小型表 不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这 些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。 4.数据完整性设计(数据库逻辑设计) 1)完整性实现机制: 实体完整性:主键 参照完整性: 父表中删除数据:级联删除:受限删除:置空值 父表中插入数据:受限插入:递归插入 父表中更新数据:级联更新:受限更新:置空值 DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规则)和触发器实现机 制 用户定义完整性: NOT NULL:CHECK:触发器 2)用约束而非商务规则强制数据完整性 采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数 据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于商务层保 证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。 3)强制指示完整性 在有害数据进入数据库之前将其别除。激活数据库系统的指示完整性特性。这样可以保 持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。 4)使用查找控制数据完整性 控制数据完整性的最佳方式就是限制用户的选择。只要有可能都应该提供给用户一个清 晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公 共数据特别适合查找:国家代码、状态代码等。 5)采用视图 为了在数据库和应用程序代码之间提供另一层抽象,可以为应用程序建立专门的视图而 不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你提供了更多的自 由。 5.其他设计技巧
使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。 3) 不要索引 memo/note 字段,不要索引大型字段(有很多字符),这样作会让索引 占用太多的存储空间。 4) 不要索引常用的小型表 不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这 些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。 4. 数据完整性设计(数据库逻辑设计) 1) 完整性实现机制: 实体完整性:主键 参照完整性: 父表中删除数据:级联删除;受限删除;置空值 父表中插入数据:受限插入;递归插入 父表中更新数据:级联更新;受限更新;置空值 DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规则)和触发器实现机 制 用户定义完整性: NOT NULL;CHECK;触发器 2) 用约束而非商务规则强制数据完整性 采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数 据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于商务层保 证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。 3) 强制指示完整性 在有害数据进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以保 持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。 4) 使用查找控制数据完整性 控制数据完整性的最佳方式就是限制用户的选择。只要有可能都应该提供给用户一个清 晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公 共数据特别适合查找:国家代码、状态代码等。 5) 采用视图 为了在数据库和应用程序代码之间提供另一层抽象,可以为应用程序建立专门的视图而 不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你提供了更多的自 由。 5. 其他设计技巧
1)避免使用触发器 触发器的功能通常可以用其他方式实现。在调试程序时触发器可能成为干扰。假如你确 实需要采用触发器,你最好集中对它文档化。 2)使用常用英语(或者其他任何语言)而不要使用编码 在创建下拉菜单、列表、报表时最好按照英语名排序。假如需要编码,可以在编码旁附 上用户知道的英语。 3)保存常用信息 让一个表专门存放一般数据库信息非常有用。在这个表里存放数据库当前版本、最近检 查/修复(对Access)、关联设计文档的名称、客户等信息。这样可以实现一种简单机制跟 踪数据库,当客户抱怨他们的数据库没有达到希望的要求而与你联系时,这样做对非客户机 /服务器环境特别有用。 4)包含版本机制 在数据库中引入版本控制机制来确定使用中的数据库的版本。时间一长,用户的需求总 是会改变的。最终可能会要求修改数据库结构。把版本信息直接存放到数据库中更为方便。 5)编制文档 对所有的快捷方式、命名规范、限制和函数都要编制文档。 采用给表、列、触发器等加注释的数据库工具。对开发、支持和跟踪修改非常有用。 对数据库文档化,或者在数据库自身的内部或者单独建立文档。这样,当过了一年多时 间后再回过头来做第2个版本,犯错的机会将大大减少。 6)测试、测试、反复测试 建立或者修订数据库之后,必须用用户新输入的数据测试数据字段。最重要的是,让用 户进行测试并且同用户一道保证选择的数据类型满足商业要求。测试需要在把新数据库投入 实际服务之前完成。 7)检查设计 在开发期间检查数据库设计的常用技术是通过其所支持的应用程序原型检查数据库。换 句话说,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看如何取出数 据。 六、数据库设计技巧总结 如果把企业的数据比做生命所必需的血液,那么数据库的设计就是应用中最重要的一 部分。有关数据库设计的材料汗牛充栋,大学学位课程里也有专门的讲述。不过,就如我们 反复强调的那样,再好的老师也比不过经验的教诲。所以我们最近找了些对数据库设计颇有 造诣的专业人士给大家传授一些设计数据库的技巧和经验。我们的编辑从收到的130个反
1) 避免使用触发器 触发器的功能通常可以用其他方式实现。在调试程序时触发器可能成为干扰。假如你确 实需要采用触发器,你最好集中对它文档化。 2) 使用常用英语(或者其他任何语言)而不要使用编码 在创建下拉菜单、列表、报表时最好按照英语名排序。假如需要编码,可以在编码旁附 上用户知道的英语。 3) 保存常用信息 让一个表专门存放一般数据库信息非常有用。在这个表里存放数据库当前版本、最近检 查/修复(对Access)、关联设计文档的名称、客户等信息。这样可以实现一种简单机制跟 踪数据库,当客户抱怨他们的数据库没有达到希望的要求而与你联系时,这样做对非客户机 /服务器环境特别有用。 4) 包含版本机制 在数据库中引入版本控制机制来确定使用中的数据库的版本。时间一长,用户的需求总 是会改变的。最终可能会要求修改数据库结构。把版本信息直接存放到数据库中更为方便。 5) 编制文档 对所有的快捷方式、命名规范、限制和函数都要编制文档。 采用给表、列、触发器等加注释的数据库工具。对开发、支持和跟踪修改非常有用。 对数据库文档化,或者在数据库自身的内部或者单独建立文档。这样,当过了一年多时 间后再回过头来做第 2 个版本,犯错的机会将大大减少。 6) 测试、测试、反复测试 建立或者修订数据库之后,必须用用户新输入的数据测试数据字段。最重要的是,让用 户进行测试并且同用户一道保证选择的数据类型满足商业要求。测试需要在把新数据库投入 实际服务之前完成。 7) 检查设计 在开发期间检查数据库设计的常用技术是通过其所支持的应用程序原型检查数据库。换 句话说,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看如何取出数 据。 六、数据库设计技巧总结 如果把企业的数据比做生命所必需的血液,那么数据库的设计就是应用中最重要的一 部分。有关数据库设计的材料汗牛充栋,大学学位课程里也有专门的讲述。不过,就如我们 反复强调的那样,再好的老师也比不过经验的教诲。所以我们最近找了些对数据库设计颇有 造诣的专业人士给大家传授一些设计数据库的技巧和经验。我们的编辑从收到的 130 个反
馈中精选了其中的60个最佳技巧,为了方便索引其内容划分为5个部分: 第1部分一设计数据库之前 1.考察现有环境 在设计一个新数据库时,你不但应该仔细研究业务需求而且还要考察现有的系统。大多 数数据库项目都不是从头开始建立的:通常,机构内总会存在用来满足特定需求的现有系统 (可能没有实现自动计算)。显然,现有系统并不完美,否则你就不必再建立新系统了。但 是对旧系统的研究可以让你发现一些可能会忽略的细微问题。一般来说,考察现有系统对你 绝对有好处。一Lamont Adams 我曾经接手过一个为地区运输公司开发的数据库项目,活不难,用的是Access数据库。 我设置了一些项目设计参数,而且同客户一道对这些参数进行了评估,事先还查看了开发环 境下所采取的工作模式,等到最后部署应用的时候,只见终端上出了几个提示符然后立马在 我面前翘辫子了!抓耳挠腮的折腾了好几个小时,我才意识到,原来这家公司的网络上跑着 两个数据库应用,而对网络的访问需要明确和严格的用户帐号及其访问权限。明白了这一点, 问题迎刃而解:只需采用客户的系统即可。这个项目给我的教训就是:记住,假如你在诸如 Access或者Interbase这类公共环境下开发应用程序,一定要从表面下手深入系统内部搞 清楚你面临的环境到底是怎么回事。一kg 2.定义标准的对象命名规范 一定要定义数据库对象的命名规范。对数据库表来说,从项目一开始就要确定表名是采 用复数还是单数形式。此外还要给表的别名定义简单规则(比方说,如果表名是一个单词, 别名就取单词的前4个字母:如果表名是两个单词,就各取两个单词的前两个字母组成4个 字母长的别名:如果表的名字由3个单词组成,你不妨从头两个单词中各取一个然后从最 后一个单词中再取出两个字母,结果还是组成4字母长的别名,其余依次类推)对工作用 表来说,表名可以加上前缀WOK后面附上采用该表的应用程序的名字。表内的列要针对 键采用一整套设计规则。比如,如果键是数字类型,你可以用0作为后缀:如果是字符类 型则可以采用_CODE后缀。对列名应该采用标准的前缀和后缀。再如,假如你的表里有好多 “money'”字段,你不妨给每个列增加一个_AMT后缀。还有,日期列最好以DATE作为名字 打头。一richard 检查表名、报表名和查询名之间的命名规范。你可能会很快就被这些不同的数据库要素 的名称搞糊涂了。假如你坚持统一地命名这些数据库的不同组成部分,至少你应该在这些对 象名字的开头用table、query或者report等前缀加以区别。一rrydenm 如果采用了Microsoft Access,你可以用qry、rpt、tbl和mod等符号来标识对象(比 如tbl_Employees)。我在和SQL Server(或者Oracle)打交道的时候还用过tbl来索引表, 但我用sp_company(现在用sp_feft_)标识存储过程,因为在有的时候如果我发现了更好 的处理办法往往会保存好几个拷贝。我在实现SQL Server2000时用udf_(或者类似的标 记)标识我编写的函数。一Timothy J.Bruce
馈中精选了其中的 60 个最佳技巧,为了方便索引其内容划分为 5 个部分: 第 1 部分— 设计数据库之前 1. 考察现有环境 在设计一个新数据库时,你不但应该仔细研究业务需求而且还要考察现有的系统。大多 数数据库项目都不是从头开始建立的;通常,机构内总会存在用来满足特定需求的现有系统 (可能没有实现自动计算)。显然,现有系统并不完美,否则你就不必再建立新系统了。但 是对旧系统的研究可以让你发现一些可能会忽略的细微问题。一般来说,考察现有系统对你 绝对有好处。— Lamont Adams 我曾经接手过一个为地区运输公司开发的数据库项目,活不难,用的是 Access 数据库。 我设置了一些项目设计参数,而且同客户一道对这些参数进行了评估,事先还查看了开发环 境下所采取的工作模式,等到最后部署应用的时候,只见终端上出了几个提示符然后立马在 我面前翘辫子了!抓耳挠腮的折腾了好几个小时,我才意识到,原来这家公司的网络上跑着 两个数据库应用,而对网络的访问需要明确和严格的用户帐号及其访问权限。明白了这一点, 问题迎刃而解:只需采用客户的系统即可。这个项目给我的教训就是:记住,假如你在诸如 Access 或者 Interbase 这类公共环境下开发应用程序,一定要从表面下手深入系统内部搞 清楚你面临的环境到底是怎么回事。— kg 2. 定义标准的对象命名规范 一定要定义数据库对象的命名规范。对数据库表来说,从项目一开始就要确定表名是采 用复数还是单数形式。此外还要给表的别名定义简单规则(比方说,如果表名是一个单词, 别名就取单词的前 4 个字母;如果表名是两个单词,就各取两个单词的前两个字母组成 4 个 字母长的别名;如果表的名字由 3 个单词组成,你不妨从头两个单词中各取一个然后从最 后一个单词中再取出两个字母,结果还是组成 4 字母长的别名,其余依次类推)对工作用 表来说,表名可以加上前缀 WORK_ 后面附上采用该表的应用程序的名字。表内的列要针对 键采用一整套设计规则。比如,如果键是数字类型,你可以用_NO 作为后缀;如果是字符类 型则可以采用_CODE 后缀。对列名应该采用标准的前缀和后缀。再如,假如你的表里有好多 “money”字段,你不妨给每个列增加一个_AMT 后缀。还有,日期列最好以 DATE_作为名字 打头。— richard 检查表名、报表名和查询名之间的命名规范。你可能会很快就被这些不同的数据库要素 的名称搞糊涂了。假如你坚持统一地命名这些数据库的不同组成部分,至少你应该在这些对 象名字的开头用 table、query 或者 report 等前缀加以区别。— rrydenm 如果采用了 Microsoft Access,你可以用 qry、rpt、tbl 和 mod 等符号来标识对象(比 如 tbl_Employees)。我在和 SQL Server(或者 Oracle)打交道的时候还用过 tbl 来索引表, 但我用 sp_company (现在用 sp_feft_)标识存储过程,因为在有的时候如果我发现了更好 的处理办法往往会保存好几个拷贝。我在实现 SQL Server 2000 时用 udf_ (或者类似的标 记)标识我编写的函数。— Timothy J. Bruce
3.预先计划 上个世纪80年代初,我还在使用资产帐目系统和System38平台,那时我负责设计所 有的日期字段,这样在不费什么力气的情况下将来就可以轻松处理2000年问题了。许多人 给我说就别去解决这一问题了,因为要处理起来太麻烦了(这在世人皆知的Y2K问题之前 很久了)。我回击说只要预先计划今后就不会遇到大麻烦。结果我只用了两周的时间就把程 序全部改完了。因为预先计划的好,后来Y2K问题对该系统的危害降到了最低程度(最近 听说该程序甚至到了1995年都还运行在AS/400系统上,唯一出现的小问题是从代码中删 除注释费了点工夫)。一generalist 4.获取数据模式资源手册 正在寻求示例模式的人可以阅读《数据模式资源手册》一书,该书由Len Silverston、 W.H.Inmon和Kent Graziano编写,是一本值得拥有的最佳数据建模图书。该书包括的章 节涵盖多种数据领域,比如人员、机构和工作效能等。一minstrelmike 5.畅想未来,但不可忘了过去的教训 我发现询问用户如何看待未来需求变化非常有用。这样做可以达到两个目的:首先, 你可以清楚地了解应用设计在哪个地方应该更具灵活性以及如何避免性能瓶颈:其次,你知 道发生事先没有确定的需求变更时用户将和你一样感到吃惊。一chrisdl 一定要记住过去的经验教训!我们开发人员还应该通过分享自己的体会和经验互相帮 助。即使用户认为他们再也不需要什么支持了,我们也应该对他们进行这方面的教育,我们 都曾经面临过这样的时刻“当初要是这么做了该多好.”。一dhattrem 6.在物理实践之前进行逻辑设计 在深入物理设计之前要先进行逻辑设计。随着大量的CASE工具不断涌现出来,你的设 计也可以达到相当高的逻辑水准,你通常可以从整体上更好地了解数据库设计所需要的方方 面面。一chardove 7.了解你的业务 在你百分百地确定系统从客户角度满足其需求之前不要在你的E(实体关系)模式中 加入哪怕一个数据表(怎么,你还没有模式?那请你参看技巧9)。了解你的企业业务可以 在以后的开发阶段节约大量的时间。一旦你明确了业务需求,你就可以自己做出许多决策了。 -rangel 一旦你认为你已经明确了业务内容,你最好同客户进行一次系统的交流。采用客户的术 语并且向他们解释你所想到的和你所听到的。同时还应该用可能、将会和必须等词汇表达出 系统的关系基数。这样你就可以让你的客户纠正你自己的理解然后做好下一步的ER设计。 一teburlew
3. 预先计划 上个世纪 80 年代初,我还在使用资产帐目系统和 System 38 平台,那时我负责设计所 有的日期字段,这样在不费什么力气的情况下将来就可以轻松处理 2000 年问题了。许多人 给我说就别去解决这一问题了,因为要处理起来太麻烦了(这在世人皆知的 Y2K 问题之前 很久了)。我回击说只要预先计划今后就不会遇到大麻烦。结果我只用了两周的时间就把程 序全部改完了。因为预先计划的好,后来 Y2K 问题对该系统的危害降到了最低程度(最近 听说该程序甚至到了 1995 年都还运行在 AS/400 系统上,唯一出现的小问题是从代码中删 除注释费了点工夫)。— generalist 4. 获取数据模式资源手册 正在寻求示例模式的人可以阅读《数据模式资源手册》一书,该书由 Len Silverston、 W. H.Inmon 和 Kent Graziano 编写,是一本值得拥有的最佳数据建模图书。该书包括的章 节涵盖多种数据领域,比如人员、机构和工作效能等。— minstrelmike 5. 畅想未来,但不可忘了过去的教训 我发现询问用户如何看待未来需求变化非常有用。这样做可以达到两个目的:首先, 你可以清楚地了解应用设计在哪个地方应该更具灵活性以及如何避免性能瓶颈;其次,你知 道发生事先没有确定的需求变更时用户将和你一样感到吃惊。— chrisdk 一定要记住过去的经验教训!我们开发人员还应该通过分享自己的体会和经验互相帮 助。即使用户认为他们再也不需要什么支持了,我们也应该对他们进行这方面的教育,我们 都曾经面临过这样的时刻“当初要是这么做了该多好..”。— dhattrem 6. 在物理实践之前进行逻辑设计 在深入物理设计之前要先进行逻辑设计。随着大量的 CASE 工具不断涌现出来,你的设 计也可以达到相当高的逻辑水准,你通常可以从整体上更好地了解数据库设计所需要的方方 面面。— chardove 7. 了解你的业务 在你百分百地确定系统从客户角度满足其需求之前不要在你的 ER(实体关系)模式中 加入哪怕一个数据表(怎么,你还没有模式?那请你参看技巧 9)。了解你的企业业务可以 在以后的开发阶段节约大量的时间。一旦你明确了业务需求,你就可以自己做出许多决策了。 — rangel 一旦你认为你已经明确了业务内容,你最好同客户进行一次系统的交流。采用客户的术 语并且向他们解释你所想到的和你所听到的。同时还应该用可能、将会和必须等词汇表达出 系统的关系基数。这样你就可以让你的客户纠正你自己的理解然后做好下一步的 ER 设计。 — teburlew