第1章数据库概论.ppt
《第1章数据库概论.ppt》由会员分享,可在线阅读,更多相关《第1章数据库概论.ppt(82页珍藏版)》请在三一文库上搜索。
1、1,第1章 数据库概论,淮阴工学院计算机工程系 冯 万 利 Email: 办公室:主楼1407,2,本章的重要概念,(1)DB、DBMS和DBS的定义 (2)数据管理技术的发展阶段 人工管理阶段、文件系统阶段、数据库系统阶段和高级数据库技术阶段等各阶段的特点。 (3)数据描述 概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二元联系的描述(1:1,1:N,M:N)。,3,(4)数据模型 数据模型的定义,两类数据模型,逻辑模型的形式定义,ER模型,层次模型、网状模型、关系模型和面向对象模型的数据结构以及联系的实现方式。 (5)DB的体系结构 三级结构,两级映象,两级数据独立
2、性,体系结构各个层次中记录的联系。 (6)DBMS DBMS的工作模式、主要功能和模块组成。 (7)DBS DBS的组成,DBA,DBS的全局结构,DBS结构的分类。,4,前 言,从20世纪50年代中期开始,计算机的应用由科学研究部门逐渐扩展到企业、行政部门。至60年代,数据处理已成为计算机的主要应用。在60年代末,数据库技术作为数据处理中的一门新技术发展起来的。经过30多年的发展,数据库技术已是计算机软件领域的一个重要分支,形成了较为完整的理论体系和实用技术。本章先回顾数据管理技术的发展过程,然后介绍数据库中的基本概念,以使读者对数据库的概貌有所了解。,5,1.1 引言,1963年,美国Ho
3、neywell公司的IDS(Integrated Data Store)系统投入运行,揭开了数据库技术的序幕。 20世纪70年代是数据库蓬勃发展的年代,网状系统和层次系统占据了整个数据库商用市场,而关系系统仅处于实验阶段。 20世纪80年代,关系系统由于使用简便以及硬件性能的改善,逐步代替网状系统和层次系统占领了市场。 20世纪90年代,关系数据库已成为数据库技术的主流。 进入21世纪以后,无论是市场的需求还是技术条件的成熟,对象数据库技术、网络数据库技术的推广和普及已成定局。,6,1.1.1 数据和信息,数据是数据库系统研究和处理的对象。数据与信息十分不开的,它们既有联系又有区别。 所谓数据
4、,通常指用符号记录下来的、可以识别的信息。 信息与数据之间存在着固有的联系:数据是信息的符号表示或称为载体;信息则是数据的内涵,是对数据语义的解释。,7,1.1.2 数据处理与数据管理,数据处理是指从某些已知的数据出发,推导加工出一些新的数据,这些新的数据又表示了新的信息。 数据管理是指数据的收集、整理、组织、存储、维护、检索、传送等操作,这部分操作是数据处理业务的基本环节,而且是任何数据处理业务中必不可少的共有部分。 数据处理是与数据管理相联系的,数据管理技术的优劣,将直接影响数据处理的效率。,8,1.1.3 数据库技术的基本术语,定义1.1 数据库(Database,简记为DB)DB是长期
5、存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。,9,定义1.2 数据库管理系统(Database Management System,简记为DBMS)DBMS是位于用户与操作系统(OS)之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型和面向对象型等。,用户,10,定义1.3 数据库系统(Database System,简记为DBS) DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问
6、的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。 定义1.4 数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。,11,1.2 数据库的由来和发展,磁盘容量的发展 数据管理技术的发展经历了人工管理、文件系统、数据库阶段和高级数据库阶段。,12,1.2.1 人工管理阶段,在人工管理阶段(20世纪50年代中期以前),计算机主要用于科学计算,其他工作还没有展开。外部存储器只有磁带、卡片和纸带等,还没有磁盘等字节存取存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理的方式基本上是批处理。 人工管理阶段的数据管理有下列特点: 数据不保存在计算机内。
7、没有专用的软件对数据进行管理。 只有程序(program)的概念,没有文件(file)的概念。数据的组织方式必须由程序员自行设计与安排。 数据面向程序。即一组数据对应一个程序。,13,1.2.2 文件系统阶段,在这一阶段(20世纪50年代后期至60年代中期),计算机不仅用于科学计算,还用于信息管理。随着数据量的增加,数据的存储、检索和维护问题成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取存储设备。软件领域出现了高级语言和操作系统。操作系统中的文件系统是专门管理外存的数据管理软件。数据处理的方式有批处理,也有联机实时处理。,14,文件系统阶段的数据管
8、理有以下特点: 数据以“文件”形式可长期保存在外部存储器的磁盘上。 数据的逻辑结构与物理结构有了区别,但比较简单。 文件组织已多样化。有索引文件、链接文件和直接存取文件等。 数据不再属于某个特定的程序,可以重复使用,即数据面向应用。 对数据的操作以记录为单位。 随着数据管理规模的扩大,数据量急剧增加,文件系统显露出三个缺陷: 数据冗余(redundancy) 数据不一致(inconsistency) 数据联系弱(poor data relationship),15,1.2.3 数据库阶段,数据管理技术进入数据库阶段的标志是20世纪60年代末的三件大事: 1968年美国IBM公司推出层次模型的I
9、MS系统 。 1969年美国CODASYL组织发布了DBTG报告,总结了当时各式各样的数据库,提出网状模型。 1970年美国IBM公司的E.F.Codd 连续发表论文,提出关系模型,奠定了关系数据库的理论基础。,16,数据库阶段的数据管理的特点,采用数据模型表示复杂的数据结构。 有较高的数据独立性。 数据库系统为用户提供了方便的用户接口。 数据库系统提供以下四方面的数据控制功能:数据库的并发控制,数据库的恢复,数据的完整性和数据安全性。 增加了系统的灵活性 。,17,数据库系统的结构,18,程序和数据间的联系,文件系统阶段信息处理的传统方式,19,数据库阶段信息处理方式的演变,20,1.2.4
10、 高级数据库技术阶段,分布式数据库系统主要有下面三个特点 数据库的数据物理上分布在各个场地,但逻辑上是一个整体。 每个场地既可以执行局部应用(访问本地DB),也可以执行全局应用(访问异地DB)。 各地的计算机由数据通信网络相联系。本地计算机单独不能胜任的处理任务,可以通过通信网络取得其它DB和计算机的支持。,21,分布式数据库系统,22,对象数据库系统主要有以下两个特点,对象数据模型能完整地描述现实世界地数据结构,能表达数据间嵌套、递归的联系。 具有面向对象技术的封装性(把数据与操作定义在一起)和继承性(继承数据结构和操作)的特点,提高了软件的可重用性。,23,1.3 数据描述,在数据处理中,
11、数据描述将涉及到不同的范畴。从事物的特性到计算机中的具体表示,实际上经历了三个阶段概念设计中的数据描述、逻辑设计中的数据描述和物理设计中的数据描述。本节先介绍这三个阶段的数据描述,再介绍数据之间联系如何描述。,24,1.3.1 概念设计中的数据描述,实体(entity):客观存在,可以相互区别的事物称为实体。 实体集(entity set):性质相同的同类实体的集合,称为实体集。 属性(attribute):实体有很多特性,每一个特性称为属性。每一个属性有一个值域,其类型可以是整数型、实数型、字符串型等。 实体标识符(identifier):能惟一标识实体的属性或属性集,称为实体标识符。有时也
12、称为关键码(key),或简称为键。,25,1.3.2 逻辑设计中的数据描述,字段(field):标记实体属性的命名单位称为字段,或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。 记录(record):字段的有序集合称为记录。 文件(file):同一类记录的集合称为文件。 关键码(key):能惟一标识文件中每个记录的字段或字段集,称为记录的关键码(简称为键)。,26,术语的对应关系,27,1.3.3 物理设计中的数据描述,位(bit,比特):一个二进制位称为“位”。一位只能取0或1两个状态。 字节(byte):8个比特称为一个字节,可以存放一个字符所对应的ASCII码。 字(w
13、ord):若干个字节组成一个字。一个字所含的二进制位的位数称为字长。 块(block):又称为物理块或物理记录。块是内存和外存交换信息的最小单位,每块的大小,通常为210214字节。 桶(bucket):外存的逻辑单位,一个桶可以包含一个物理块或多个在空间上不一定连续的物理块。 卷(volume):一个输入输出设备所能装载的全部有用信息,称为“卷”。,28,1.3.4 数据联系的描述,定义1.5 联系(relationship)是实体之间的相互关系。与一个联系有关的实体集个数,称为联系的元数。 定义1.6 二元联系有以下三种类型: 一对一联系:如果实体集E1中每个实体至多和实体集E2中的一个实
14、体有联系,反之亦然,那么实体集E1和E2的联系称为“一对一联系”,记为“1:1”。 一对多联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体间有联系,而E2中每个实体至多和E1中一个实体有联系,那么称E1对E2的联系是“一对多联系”,记为“1:N”。 多对多联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么称E1和E2的联系是“多对多联系”,记为“M:N”。,29,数据联系的描述示例,例1.1,30,数据联系的描述示例,例1.1,图1.10 多对多联系,31,数据联系的描述示例,例1.2,图1.11 三元联系,图1.12 一元联
15、系,32,1.4 数据模型的定义,定义1.7 数据模型的简单定义: 能表示实体类型及实体间联系的模型称为“数据模型”。概念数据模型和逻辑数据模型。 定义1.832 逻辑数据模型应包含数据结构、数据操作和数据完整性约束三个部分: 数据结构是指对实体类型和实体间联系的表达和实现; 数据操作是指对数据库的检索和更新(包括插入、删除和修改)两类操作; 数据完整性约束给出数据及其联系应具有的制约和依赖规则。,33,E-R模型图的描述方法 E-R数据模型是语义数据模型,当初提出E-R数据模型的目的有3个: (1) 建立一个统一的数据模型,以概括3种传统数据模型; (2) 作为三种传统数据模型相互转换的中间
16、模型; (3) 作为超脱DBMS的一种概念数据模型,以比较自然的方式模拟现实世界。 E-R数据模型用得最成功和最广泛的是作为数据库概念设计的数据模型。,1.4.2 实体联系模型,34,ER图有三个基本成分,矩形框,用于表示实体类型(考虑问题的对象)。 菱形框,用于表示联系类型(实体间联系)。 椭圆形框,用于表示实体类型和联系类型的属性。 用弧(连线)表示联系的约束。每条孤上附加一对数表示对参与联系的每个角色的约束,即该角色参与到该联系中的最大可能性。,35,E-R模型支持一对一、一对多和多对多的联系。实体集之间三种联系的表示如图2-5。,36,连线上的数据,连线上的数字有两种表示方法: 表示方
17、法1:用一对数,表示实体角色的最大参与度。 表示方法2:用两对数,表示实体角色的最小和最大参与度。,37,E-R模型的示例,1.实体集之间的联系 2.实体集内实体之间的联系 3.多重联系和多元联系 4. 实体属性和联系属性 5.其他的E-R模型,38,E-R模型的示例(1),实体集之间的联系,39,E-R模型的示例(2),实体集内实体之间的联系,40,E-R模型的示例(3),多重联系和多元联系,41,E-R模型的示例(4),实体属性和联系属性,42,E-R模型的示例(5),43,E-R数据模型小结,有丰富的语义表达能力,能充分反映现实世界,包括实体和实体间的联系,能满足用户对数据对象的处理要求
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 概论
链接地址:https://www.31doc.com/p-2548138.html