七章数据库设计.ppt
《七章数据库设计.ppt》由会员分享,可在线阅读,更多相关《七章数据库设计.ppt(129页珍藏版)》请在三一文库上搜索。
1、第七章 数据库设计,7.1 数据库设计概述 7.2 需求分析 7.3 概念结构设计 7.4 逻辑结构设计 7.5 数据库的物理设计 7.6 数据库实施和维护 7.7 小结,什么是数据库设计 数据库设计是指对于一个给定的应用环境,构造最优的数据库逻辑模式和物理结构,并根据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求(信息管理要求和数据操作要求) 在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。,7.1 数据库设计概述,7.1.1 数据库设计的特点,一、数据库建设的基本规律 三分技术,七分管理,十二分基础数据; 二、结构(数据)设计和行为(处理)设
2、计相结合 结构(数据)设计:设计数据库框架或数据库结构; 行为(处理)设计:设计应用程序、事务处理等。 三、结构和行为分离的设计 传统的软件工程忽视对应用中数据语义的分析和抽象,只要有可能就尽量推迟数据结构设计的决策 早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计,结构特性和行为特性结合起来,7.1.2 数据库设计方法,一、要求数据库设计人员应该具备的技术和知识 数据库的基本知识; 软件工程的原理和方法; 程序设计的方法和技巧; 数据库的基本知识和设计技术; 应用领域的知识。,二、规范设计法(本质上看:手工设计方法) 新奥尔良(New Orleans)方法 将数据库设计分为四
3、个阶段(需求分析、概念设计、逻辑设计、物理设计) 基于E-R模型的数据库设计方法 3NF的设计方法 ODL方法:面向对象的数据库设计方法 计算机辅助设计 ORACLE Designer 2000 SYBASE PowerDesigner,7.1.3 数据库设计的基本步骤,一、数据库设计的准备工作(选定参加设计的人员) 1. 数据库分析设计人员 数据库设计的核心人员 自始至终参与数据库设计 其水平决定了数据库系统的质量 2. 用户 在数据库设计中也是举足轻重的 主要参加需求分析和数据库的运行维护 用户积极参与带来的好处 加速数据库设计 提高数据库设计的质量 3. 程序员(在系统实施阶段参与进来,
4、负责编制程序) 4. 操作员(在系统实施阶段参与进来,准备软硬件环境),需求分析阶段 概念结构设计阶段 逻辑结构设计阶段 数据库物理设计阶段 数据库实施阶段 数据库运行和维护阶段,准确了解与分析用户需求(包括数据与处理); 是整个设计过程的基础,是最困难、最耗费时间的一步。 需求分析是设计数据库的起点 需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用,是整个数据库设计的关键; 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型(E-R图)。,将概念结构转换为某个DBMS所支持的数据模型(关系数据模型); 对其进行
5、优化。 然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式,为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法) 根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式,运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果 建立数据库 编制与调试应用程序 组织数据入库 并进行试运行,数据库应用系统经过试运行后即可投入正式运行。 在数据库系统运行过程中必须不断地对其进行评价、调整与修改。,设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。 (如:P202图7.2),二、数据库设计
6、的过程(六个阶段),设计特点,在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来 将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计 设计过程各个阶段的设计描述:P204图7.3,7.1.4 数据库设计过程中的各级模式,7.2 需求分析,7.2.1 需求分析的任务,一、需求分析的任务 二、需求分析的重点 三、需求分析的难点,一、需求分析的任务,通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求。 在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变
7、,不能仅仅按当前应用需求来设计数据库,二、需求分析的重点,需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。 信息要求 用户需要从数据库中获得信息的内容与性质 由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据 处理要求 对处理功能的要求 对处理的响应时间的要求 对处理方式的要求(批处理 / 联机处理) 安全性与完整性要求。,三、需求分析的难点,确定用户最终需求的难点 用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。 设计人员缺少用户的专业知识,不易理
8、解用户的真正需求,甚至误解用户的需求。 新的硬件、软件技术的出现也会使用户需求发生变化。 解决方法 设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求,7.2.2 需求分析的方法,调查清楚用户的实际需求并进行初步分析,与用户达成共识,然后 进一步分析与表达这些需求。,一、 调查用户需求的具体步骤, 调查组织机构情况(为分析信息流程做准备) 组织部门的组成情况 各部门的职责等 调查各部门的业务活动情况。调查重点之一。 各个部门输入和使用什么数据 如何加工处理这些数据 输出什么信息 输出到什么部门 输出结果的格式是什么, 在熟悉业务活动的基础上,协助用户明确对新系
9、统的各种要求(信息要求、处理要求、完全性与完整性要求)。调查重点之二。 确定新系统的边界 对前面调查的结果进行初步分析,确定哪些功能由计算机完成或将来准备让计算机完成;确定哪些活动由人工完成。 由计算机完成的功能就是新系统应该实现的功能。,常用调查方法 跟班作业 开调查会 请专人介绍 询问 设计调查表请用户填写 查阅记录,二、常用调查方法,做需求调查时,往往需要同时采用多种方法,无论使用何种调查方法,都必须有用户的积极参与和配合。 设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果共同承担责任。,通过亲身参加业务工作了解业务活动的情况。能
10、比较准确地理解用户的需求,但比较耗时。,通过与用户座谈来了解业务活动情况及用户需求。,对某些调查中的问题,可以找专人询问,如果调查表设计合理,则很有效,且易于为用户接受,查阅与原系统有关的数据记录,三、进一步分析和表达用户需求,分析和表达用户的需求的常用方法 自顶向下的结构化分析方法(Structured Analysis,简称SA方法) SA方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。,1首先把任何一个系统都抽象为:,2分解处理功能和数据 (1)分解处理功能 将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达
11、清楚为止。 (2)分解数据 在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图。 数据流图表达了数据和处理过程的关系。 (3)表达方法 处理过程:用判定表或判定树来描述 数据:用数据字典来描述 3将分析结果再次提交给用户,征得用户的认可,四、需求分析过程,图7.6 需求分析过程,7.2.3 数据字典和数据流图,一、数据字典的用途,数据字典是各类数据描述的集合 数据字典是进行详细的数据收集和数据分析所获得的主要结果 数据字典在数据库设计中占有很重要的地位,二、数据字典的内容,数据字典的内容 数据项 数据结构 数据流 数据存储 处理过程 数据项是数据的最小组成单位 若干个数据
12、项可以组成一个数据结构 数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。, 数据项,数据项是不可再分的数据单位 对数据项的描述 数据项描述数据项名,数据项含义说明, 别名,数据类型,长度,取值范围, 取值含义,与其他数据项的逻辑关系 取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件, 数据结构,数据结构反映了数据之间的组合关系。 一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。 对数据结构的描述 数据结构描述数据结构名,含义说明,组成:数据项或数据结构, 数据流,数据流是数据结构在系统内传输的路径。 对数据流的
13、描述 数据流描述数据流名,说明,数据流来源, 数据流去向,组成:数据结构, 平均流量,高峰期流量 数据流来源是说明该数据流来自哪个过程 数据流去向是说明该数据流将到哪个过程去 平均流量是指在单位时间(每天、每周、每月等)里的传输次数 高峰期流量则是指在高峰时期的数据流量, 数据存储,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。 对数据存储的描述 数据存储描述数据存储名,说明,编号, 流入的数据流 ,流出的数据流 , 组成:数据结构,数据量,存取方式 流入的数据流:指出数据来源 流出的数据流:指出数据去向 数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息 存取
14、方法:批处理 / 联机处理;检索 / 更新;顺序检索 / 随机检索, 处理过程,处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息 处理过程说明性信息的描述 处理过程描述处理过程名,说明, 输入:数据流,输出:数据流, 处理:简要说明 简要说明:主要说明该处理过程的功能及处理要求 功能:该处理过程用来做什么 处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等 处理要求是后面物理设计的输入及性能评价的标准,数据字典举例,例:学生学籍管理子系统的数据字典。 数据项,以“学号”为例: 数据项: 学号 含义说明:唯一标识每个学生 别名
15、: 学生编号 类型: 字符型 长度: 8 取值范围:00000000至99999999 取值含义:前两位标别该学生所在年级, 后六位按顺序编号 与其他数据项的逻辑关系:,数据结构 以“学生”为例 “学生”是该系统中的一个核心数据结构: 数据结构:学生 含义说明:是学籍管理子系统的主体数据结构,定义了一个学生 的有关信息 组成: 学号,姓名,性别,年龄,所在系,年级,数据流“体检结果”可如下描述: 数据流: 体检结果 说明: 学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成: 平均流量: 高峰期流量:,数据存储“学生登记表”可如下描述: 数据存储: 学生登记表 说明: 记录学
16、生的基本情况 流入数据流: 流出数据流: 组成: 数据量: 每年3000张 存取方式: 随机存取,处理过程“分配宿舍”可如下描述: 处理过程:分配宿舍 说明: 为所有新生分配学生宿舍 输入: 学生,宿舍, 输出: 宿舍安排 处理: 在新生报到后,为所有新生分配学 生宿舍。要求同一间宿舍只能安排 同一性别的学生,同一个学生只能 安排在一个宿舍中。每个学生的居 住面积不小于3平方米。安排新生 宿舍其处理时间应不超过15分钟。,三、数据流图(Data Flow Diagram,简称DFD),数据流图是描绘系统逻辑模型的一种网络表示(这里的系统可以是自动化系统、手工系统或是两者混合而成的系统)。数据流
17、图通过它的成分及所标明各个成分之间的接口来描述系统,数据流图的基本成分是: 1.数据流; 2.文件(数据存储); 3.加工(亦称处理、过程或变换); 4.数据源点或终点。,是某种已知构成的信息所流过的通道,是数据的暂存区,是系统之外的人或组织;这些人或组织是单纯数据的产生源或接收者,是一种将进入数据流转化为流出数据流的变换,命名原则:要具体,便于区分,名副其实,反映功用,数据流图常用的符号,1.数据流 用箭头线表示;,2.文件(数据存储) 用开口矩形或两条平行横线表示;,3.加工(亦称处理、过程或变换) 用圆角矩形或圆形表示;,4.数据源点或终点 用正方形或立方体表示。,7.3.1 概念结构,
18、什么是概念结构设计 需求分析阶段描述的用户应用需求是现实世界的具体需求 将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计 概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。 概念结构设计是整个数据库设计的关键,概念结构设计的特点 (1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。 (2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。 (3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。 (4)易于向关系、网状、层
19、次等各种数据模型转换 描述概念模型的工具 E-R模型,自底向上 首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构,7.3.2 概念结构设计的方法与步骤,设计概念结构的四类方法 自顶向下 首先定义全局概念结构的框架,然后逐步细化,逐步扩张 首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构,混合策略 将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。,概念结构设计的方法与步骤(续),常用策略(P211图7.8) 自顶向下进行需求分析 自底向上设计概念结构,自底向
20、上设计概念结构的步骤 (P211图7.9) 第1步:抽象数据并设计局部视图 第2步:集成局部视图,得到全局概念结构,图7.9 自底向上方法的设计步骤,需求分析,数据抽象、 局部视图设计,视图集成,征求用户意见,DFD、DD,局部ER图,全局ER图,逻辑结构设计,概念结构是对现实世界的一种抽象 从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节 把这些特性用各种概念精确地加以描述 这些概念组成了某种模型 三种常用抽象 1. 分类(Classification) 定义某一类概念作为现实世界中一组对象的类型 这些对象具有某些共同的特性和行为 它抽象了对象值和型之间的“is member
21、 of”的语义 在E-R模型中,实体型就是这种抽象 例:P212图7.10,一、数据抽象,7.3.3 数据抽象与局部视图设计,2. 聚集(Aggregation) 定义某一类型的组成成分 它抽象了对象内部类型和成分之间“is part of”的语义 在E-R模型中若干属性的聚集组成了实体型,就是这种抽象 例:P212图7.11,图7.12,3. 概括(Generalization) 定义类型之间的一种子集联系 它抽象了类型之间的“is subset of”的语义 概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。 例:P213图7.13,注:原E-R模型不具有概括,本书对E-R模型
22、作了扩充,允许定义超类实体型和子类实体型。 用双竖边的矩形框表示子类, 用直线加小圆圈表示超类-子类的联系,数据抽象的用途 对需求分析阶段收集到的数据进行分类、组织(聚集),形成 实体 实体的属性,标识实体的码 确定实体之间的联系类型(1:1,1:n,m:n),二、局部视图设计,设计分E-R图的步骤: 选择局部应用 逐一设计分E-R图, 选择局部应用,需求分析阶段,已用多层数据流图和数据字典描述了整个系统。 设计分E-R图首先需要根据系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图,让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分E-R图。 通常以中层数
23、据流图作为设计分E-R图的依据。原因: 高层数据流图只能反映系统的概貌 中层数据流图能较好地反映系统中各局部应用的子系统组成 低层数据流图过细,实例:某工厂的信息管理系统,图7.14 设计分E-R图的出发点, 逐一设计分E-R图,任务标定局部应用中的实体、属性、码,实体间的联系 将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(1:1,1:n,m:n) 如何抽象实体和属性 实体:现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和实体之间是“is member of“的关系。 例:在学校
24、环境中,可把张三、李四等对象抽象为学生实体。 属性:对象类型的组成成分可以抽象为实体的属性。组成成分与对象类型之间是“is part of“的关系。 例:学号、姓名、专业、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码,如何区分实体和属性 实体与属性是相对而言的。同一事物,在一种应用环境中作为“属性”,在另一种应用环境中就必须作为“实体”。 例:学校中的系,在某种应用环境中,它只是作为“学生”实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。 一般原则 属性不能再具有需要描述的性质。即属性必
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 设计
链接地址:https://www.31doc.com/p-2582761.html