数据库设计理论
一、 数据库设计的几个原则
一个好的数据库产品不等于就是一个好的应用系统,如果不能设计一个合理的数据库模型,不仅会增加客户端与服务器端的编程和维护难度,而且会影响系统实际运行的性能。因此,要想开发出一款理想的数据库产品应遵循以下设计准则:
(1) 命名规范化
不同的数据库产品对对象的命名有不同的要求。数据库中的各种对象的命名以及后台程序的代码编写应采用大小写敏感的字母形式,各种对象命名长度不要超过30个字符,这样便于应用系统适应不同的数据库。
(2) 慎用游标(Cursor)
对多表和大表定义的游标(大的数据集合)而言,使用游标逐行遍历数据很容易使程序进入漫长的等待甚至死机,因此在使用游标时,可以考虑建立一个临时表,将符合条件的数据行转入临时表中,再对临时表定义游标进行操作,这时性能会得到明显提高。
(3) 索引(Index)的使用
索引一般用于快速访问表中的数据。大型数据库有两种索引,即簇索引和非簇索引。添加任何一种索引均能提高按索引列查询的速度,但会降低插入、更新、删除操作的性能,尤其是当填充因子(Fill Factor)较大时。所以,如果要对索引较多的表进行频繁的插入、更新、删除操作,建立表和索引时应该设置较小的填充因子,以便在各项数据页中留下较多的自由空间,减少页分割及重新重新组织的工作,这样才能够提高性能。
(4) 数据的一致性和完整性
为了保证数据库的一致性和完整性,设计人员往往会设计过多的表间关联,尽可能地降低数据的冗余。但是,表间关联是一种强制性措施,建立后,对父表和子表的插入、更新、删除操作均要占用系统的开销。此外,最好不要用Identify属性字段作为主键与子表关联。如果数据冗余低,数据的完整性容易得到保证,但增加了表间连接查询的操作,因此,为了提高系统的响应时间,合理的数据冗余也是必要的。
(5) 事务的使用
事务是必须一次性完成的一组操作。虽然这些操作是单个的操作,但数据库系统能够保证这组操作要么全部都完成,要么一点都不做。正是大型数据库的这一特性,使得数据的完整性得到了极大的保证。
(6) 数据库性能调整
在计算机硬件配置和网络设计确定的情况下,影响到应用系统性能的因素主要是数据库性能和客户端程序设计。大多数数据库设计员采用两步法进行数据库设计:首先进行逻辑设计,而后进行物理设计。数据库逻辑设计去除了所有冗余数据,提高了数据吞吐速度,保证了数据的完整性,清楚地表达数据元素之间的关系。而对于多表之间的关联查询(尤其是大数据表)时,其性能将会降低,同时也提高了客户端程序的编程难度,因此,物理设计需折中考虑,根据业务规则,确定关联表的数据量大小、数据项的访问频度,对此类数据表频繁的关联查询应适当提高数据冗余设计。
(7) 数据类型的选择
数据类型的合理选择对于数据库的性能和操作具有很大的影响。
? Identify字段不要作为表的主键与其他表关联,这将会影响到该表的数据迁移。
? Text和Image字段属指针型数据,主要用来存放二进制大型对象(BLOB)。这类数据的操作相比其他数据类型较慢,因此要避开使用。
? 日期型字段的优点是有众多的日期函数支持,因此,在日期的大小比较、加减操作上非常简单。但是,按照日期作为条件的查询操作也要用函数,相比其他数据类型在速度上就慢许多。这是因为用函数作为查询的条件时,服务器无法用先进的性能策略来优化查询,只能进行表扫描遍历每行。
二、 数据库设计的基本步骤
对于数据库设计来说,比较统一的看法是分为5个步骤:需求分析,概念结构设计,逻辑结构设计,物理设计,数据实施和维护。
1. 需求分析
要设计一个良好的数据库系统,首先要明确应用环境对系统的要求。因此,对应用环境的需求收集和分析就是数据库设计的第一步。需求阶段收集到的基础数据和一组数据流程图是进行下一步概念设计的基础。需求分析包括以下几个方面:
(1) 收集资料
收集资料是数据库设计人员和用户共同完成的任务。强调各级用户的参与是数据库应用系统设计的特点之一。
(2) 分析整理
在大量资料收集完成以后,就要对资料进行分析和整理。分析的过程是对所收集到的数据进行抽象的过程。
(3) 数据流程图
在系统分析中通常采用数据流程图(Data Flow Diagram)来描述系统的数据流向和对数据的处理功能。
(4) 数据字典(Data Dictionary)
除了一套数据流程图外,还要从原始的数据资料中分析整理出下述数据信息:数据元素的名称、同义词、性质、取值范围、提供者、使用者、控制权限、保密要求、使用频率、数据量、数据之间联系的语义说明、各个部门对数据的要求以及数据处理要求。
(5) 用户确认
数据流程图集和数据字典的内容必须返回给用户,并且用非专业术语与用户交流。
需求分析阶段的成果要形成文档资料,至少包括各项业务的数据流程图及有关说明和对各类数据描述的集合,即数据字典。
2. 概念结构设计
将需求分析得到的用户需求抽象为信息结构设计及概念模型的过程就是概念结构设计,它是整个数据库设计的关键。概念建模的过程包括定义实体集、定义联系和定义属性。当这3种成分确定之后,就可以用E-R方法来进行数据库的概念设计。在设计完全局的E-R图之后,要尽量消除冗余。
3. 逻辑结构设计
数据库逻辑设计的任务是将概念结构设计阶段设计好的基本E-R图,转换成特定DBMS所支持的数据模型的过程。这样开始进入“实现设计”,需要考虑具体DBMS的性能,具体的数据模型特点。逻辑设计可分为E-R图向关系模型的转化、数据模型的优化和设计用户子模式3个过程。
4. 物理设计
对于给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,称为数据库物理设计。数据库的物理设计通常分为两步:确定数据库的物理结构,在关系数据库中主要指存取方法与存储结构:对物理结构进行评价,评价的重点的时间和空间效率。
5. 数据库的实施和维护
数据库的实施和维护过程可分数据的载入和应用程序的调试、数据库的试运行和数据库的维护与运行。
posted on 2008-02-18 09:47
lk 阅读(410)
评论(0) 编辑 收藏 所属分类:
DB