《信息系统与数据库.ppt》由会员分享,可在线阅读,更多相关《信息系统与数据库.ppt(146页珍藏版)》请在三一文库上搜索。
1、第六章 信息系统与数据库,6.1 计算机信息系统,6.1.2 信息系统的结构,6.1.4 信息系统的发展趋势,6.1.3 信息系统的类型,6.1.1 什么是计算机信息系统,计算机信息系统(Computer_based Information System )是一类以提供信息服务为主要目的的数据密集型、人机交互的计算机应用系统。,计算机信息系统,涉及的数据量大 绝大部分数据是持久的 这些持久数据为多个应用程序所共享,甚至在一个单位或更大范围内共享 除具有数据采集、传输、存储和管理等基本功能外,还可向用户提供信息检索,统计报表、事务处理、分析、控制、预测、决策、报警、提示等信息服务,计算机信息系统
2、技术上的特点,“信息”和“数据”这两个概念在计算机信息处理中是既有区别又有联系的。 信息指的是人们要解释的那些数据的含义。 数据是事实、概念或指令的一种可供计算机加工处理的特殊表示形式. 信息处理的过程实际上就是数据处理,数据处理的目的是获取有用的信息。,6.1.2 信息系统的结构,虽然信息系统是多种多样的,但其基本结构又是共同的,信息系统的层次结构可分为: 基础设施层 资源管理层 业务逻辑层 应用表现层,可将计算机信息系统视为面向信息的,由计算机硬件、软件和相关的人员共同组织成一个整体的计算机应用系统。,6.1.3 信息系统的类型,从信息处理的深度来区分信息系统,可分为4大类,这些系统还可以
3、按处理深度再继续进行划分。,信息系统的类型,1 业务信息处理系统,从信息学的角度看,业务信息处理系统是一次信息(直接信息)的生产和处理系统。由于在企事业单位中不同层次的业务信息处理系统服务对象不同,因而可以进一步将它分为三类。 (1)操作层业务处理系统 (2)管理层业务处理系统 (3)知识层业务处理系统,信息检索系统(Information Retrieval System)将原始信息(一次情报)预处理生成的二次信息(二次情报)输入到计算机中,经过计算机的加工再处理,生成具有一定结构的供检索用的情报数据库。 信息检索系统不是为一个单位服务的,它可以供广大的用户使用,例如我国用于科学技术“查新”
4、建立有各类科学和技术的文献数据库(如中国科技文献库、中国科技成果库、中国专利数据库、中国学位论文数据库,中国学术会议数据库等),世界上著名的情报检索系统(如DIALOG、ORBIT等)包含的众多数据库,均可向有关人员提供联机检索服务。, 信息检索系统,信息检索系统的特点: 信息量大 检索功能强 服务面广 根据获得最终检索结果的详细程度和检索词的来源不同将信息检索系统分为两大类: 目录检索系统 全文检索系统 从信息的内容来划分信息检索系统,将其分为: 文献检索系统 事实检索系统 数值检索系统等,信息分析系统是为管理决策人员掌握企事业单位运行规律和趋势,制订规划、进行决策的辅助系统。 是一种高层次
5、的信息系统,三次信息的处理系统。,决策支持系统 经理支持系统, 信息分析系统 (Information Analysis System),两种常见的信息分析系统:,决策支持系统(Decision Support System,简称DSS)是辅助决策者通过数据、模型、知识以人机交互方式进行半结构化或非结构化决策的计算机信息系统。,经理支持系统(Executive Support System,简称ESS)不提供某种固定的应用或某种具体的能力,而是提供一个综合性的计算和通信环境。,专家系统(Expert System,简称ES)是一种知识信息的加工处理系统,也是人工智能最为重要的应用系统。 专家系
6、统模仿人类专家的思维活动,通过推理与判断来求解问题。 一个专家系统通常由两部分组成:一部分是称为知识库的知识集合,它包括要处理问题的领域知识,另一部分是称为推理机的程序模块。推理是指从已有事实推出新事实(或结论)的过程。, 专家系统,6.1.4 信息系统的发展趋势,信息系统的发展趋势:,信息多媒体化 系统集成化 功能智能化 结构分布化,本 节 考 题,从信息处理的深度来区分,信息系统可以分为业务信息处 理系统、信息检索系统、信息分析系统和专家系统。在下 列相关叙述中,错误的是: A 业务信息处理系统是采用计算机进行日常业务处理的信息系统 B 信息检索系统就是指因特网上提供的各种搜索引擎,可以供
7、各类用户免费使用 C 决策支持系统是一种常见的信息分析系统 D 专家系统可模仿人类专家的思维活动,通过推理与判断来求解问题。,6.2 数据库系统及应用,6.2.1 数据管理技术的发展,计算机数据管理技术的发展可划分为三个阶段: 人工管理阶段 文件系统阶段 数据库系统阶段,数据库管理系统(Data Base Management System ,简称DBMS)以统一管理和共享数据为主要特征,数据库系统阶段,数据不再仅仅服务于某个程序或用户,而是按一定的结构存储于数据库,作为共享资源,由数据库管理系统的软件管理,使得数据能为尽可能多的应用服务。,DBMS中应用程序与数据的关系,(1) 数据结构化。
8、 (2) 数据共享性高,冗余度低。 (3) 系统灵活,易于扩充。 (4) 数据独立于程序。 (5) 统一管理和控制数据。 (6) 具有良好的用户接口。,数据库系统的特点,数 据 独 立 性,逻辑独立性:是指用户的应用程序与数据库的逻辑结构相互独立。 物理独立性:是指用户的应用程序与存储在数据库中的数据相互独立。,数据库系统的组成,(1)计算机支持系统 (2)数据库 (3)数据库管理系统 (4)人员,6.2.2 数据模型(Data Model),在数据库系统中,一般采用数据模型来对现实世界数据进行抽象。 数据模型是数据库系统中用于数据表示和操作的一组概念和定义。 各种数据库产品都是基于某种数据模
9、型的。,首先把现实世界的对象抽象为某一种不依赖于具体计算机系统的数据结构(概念模型);然后再把概念模型转换为计算机中DBMS所支持的数据模型,概念模型可以按用户观点准确地模拟应用单位对数据的描述及业务需求,即对应用数据和信息建模。 建模的最终目的是按计算机系统所支持的数据模型来组织数据。 数据模型要用严格的形式化定义来描述数据的结构特点和结构约束。 通常一个数据模型包括以下两方面的内容: 数据静态的特性 它包括数据的基本逻辑结构,数据间的联系和数据中的完整性约束,以保证数据的正确、有效和相容。 数据的动态特性 它指定义在数据上的操作,包括这些操作的规则及实现操作的语言。 目前常用“实体-联系(
10、Entity-Relationship,简称E_R)”方法来建立概念模型。,概念模型 是对应用单位数据的第一次抽象,也是用户和数据库设计人员之间进行交流与沟通的工具。,ER概念模型有关术语 实体:凡是可以被人们识别而又可以互相区别的客观对象统统抽象为实体(Entity)。具有共性的一类实体可以组合为一个实体集。 属性:实体一般具有若干特征,用于描述其性质,这种特征称之为实体的属性(Attribute)。称每个属性的取值范围为值域。 实体主键:能够唯一标识实体的属性或属性组(这组属性的任何真子集无此性质)称为实体集的实体键。 联系:抽象到概念系统中的实体之间会有各种联系(Relationship
11、)。 如果一个实体集有多个实体键存在,则可从中选一个最常用的作为实体主键,简称主键(Primary Key)。,联系又可分为两种: 1. 实体集内部的联系 2. 实体集之间的联系,三类不同语义的联系:(以二元联系(两个实体集之间的联系)为例) 一对一联系(1:1) 对于实体集A的每一个实体,实体集B中至多有一个实体与之联系;反之亦然,则称实体集A和实体集B具有1:1联系 一对多联系(1:n) 对于实体集A中的每一个实体,实体集B中有n个实体与之联系;而对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B存在1:n的联系。 多对多联系(m:n) 若对于实体集A中
12、的每一个实体,实体集B中有n个实体与之联系;而对于实体集B中的每一个实体,实体集A中也有m个实体与之联系,则称该二个实体集A,B之间存在m:n联系,ER图,数据模型,层次模型(Hierarchica Model) 层次模型用树结构表示实体集之间的联系。 网状模型(Network Model) 用网络结构表示实体集之间联系的数据模型。 关系模型(Relational Model) 用二维表结构表示实体集以及实体集之间联系的数据模型 面向对象模型(Object-Orinted Model),在面向对象模型中把现实世界的实体都模拟为一种对象,并把类似的对象归并为一类(Class) 每个对象有一个状态
13、,对象的状态是该对象属性值的集合 每个对象有一组操作,而每个操作决定对象的一种行为 每个对象有一个唯一的标识符,它把对象状态和对象行为“封装”在一起 对象之间通过消息进行通信。当一个对象要求另一个对象做某个动作时,就向它发送一个消息,以激活该对象的某个方法 对象的每个方法都对应且仅对应一条消息 对象运行的结果也以消息的形式给出,面向对象模型,6.2.3 关系数据库,(1)关系数据模型的逻辑结构 关系数据模型的基本结构是关系 关系数据模型中数据的逻辑结构是一张二维表(Table),它由表名、行和列组成。表的每一行称为一个元组(Tuple),每一列称为一个属性(Attribute)。 用关系数据模
14、型对一个具体单位中客观对象的实体集、属性和联系的结构描述,一般称为关系数据模式(Data Schema),而二维表中的内容即为其实例。 关系数据模式的一般描述形式为: R(A1,A2,Ai,An),1 关系数据模型的数据结构,(2)关系数据模型的存储结构 在关系数据模型中,实体集、实体集之间的联系都用二维表来表示。在支持关系模型的数据库(即关系数据库)物理组织中,二维表以文件形式存储。在大多数数据库中,二维表与操作系统中的文件相对应。,(3)关系数据模型的特点,在这一节里,我们从集合论角度给出关系数据结构的形式化定义。 【定义1】域(Domain)是一组具有相同数据类型的值的集合。 【定义2】
15、给定一组域D1,D2,Dn,这些域中可以有相同的。其笛卡尔积(Cartesian product)为:D1D2 Dn = (d1,d2,dn)| diDi , i = 1,2,n 。,2 关系模型结构的形式化定义,【定义3】D1D2Dn的子集称为在域D1,D2,Dn上的关系。 若D1,D2,Dn对应的属性名为A1,A2,,An,则可将这种关系的结构表示如下: R(A1/D1, A2/D2,An/Dn),可简化为:R(A1,A2,,An) 与前述相一致,称这种结构为关系数据模式,其中R为关系数据模式的名,n为关系数据模式的属性的个数,称为关系的目(degree或arity)。关系中的每个元素称关
16、系的元组(Tuple),用t表示。由此,若R的值用r来表示,它是n目元组t的集合,即:r = t1,t2,tm。其中,每个元组t可表示为: t = (v1,v2,vm), viDi,1in,在关系数据模型中,对每个关系还作了一些限制,关系模式用R(A1,A2,An)表示,仅仅说明关系的语法,但是并不是每个合乎语法的元组都能成为R的元组,它还要受到语义的限制。数据的语义不但会限制属性的值,数据的语义还会制约属性间的关系,这些约束可以用来保证数据库中数据的正确性,称其为关系数据模型的完整性约束。 三类关系数据模型的完整性规则: (1)实体完整性 (2)引用完整性 (3)用户定义完整性约束,3 关系
17、数据模型的完整性,(1)实体完整性 若属性A为关系R的主键,则A不能为空值(即其值处于未知状态,记为Null)或重值。,【定义4】设F是基本关系R(指对应实际存储的文件)的一个或一组属性,但不是R的主键。如果F与另一个基本关系S的主键KS相对应,则称F是基本关系R的外键(Foreign key),关系R和S可以是同一个关系。,(2)引用完整性 R1的外键F要么是被引用关系R2中某一元组实际存在的主键值,要么为空值。简单地说,即“引用完整性”要求在关系中不允许引用不存在的实体(即元组)。,(3)用户定义完整性约束 用户定义完整性它反映某一具体应用所涉及的数据必须满足的语义要求,由应用环境对数据的
18、需求而决定。,E_R概念模型转换为关系模式的两条原则 实体的转换 联系的转换,“联系”转换成”关系模式”中的主键应仔细考虑:,联系 为 1:1 联系 为 1:n 联系 为 m:n,4 E_R概念模型转换为关系数据模式,6.2.4 关系代数操作,关系数据模型提供了关系操作的能力,这种操作能力可用代数方式和逻辑方式来表示,分别称为关系代数和关系演算。 关系代数:用对关系的运算来表达查询要求的方法 (代数方式表示) 关系演算:用谓词来表达查询要求的方式 (逻辑方式表示) 关系代数操作简称为关系操作。分为两类: 传统的集合操作 关系专用的操作 关系操作的结果仍为关系,可以再参与其他关系操作,构成关系代
19、数表达式,由此描述对关系的各种复杂操作。,关系是元组的集合,因此集合运算均可适用于关系。,(2)差操作 设关系R和S并相容,其差操作(Difference)表示为R-S,操作结果生成一个新关系,其元组由属于R,但不属于S的元组组成:,1 传统的集合操作,(1)并操作 设有关系R和关系S,它们有相同的模式结构(称R与S是“并相容” ),其并操作(Union)表示为RS,操作结果生成一个新的关系,其元组由属于R的元组和属于S的元组共同组成:,并、差、交、积,(3)交操作 (Intersection) 设关系R和S并相容,其交操作表示为:RS,操作结果为: 即结果关系中的元组由既属于R又属于S的元组
20、组成。,关系的交可以用差来表示:,或者,(4)广义笛卡尔积 设关系R和S分别具有p和q个属性,定义R和S的广义笛卡尔积(Extended Cartesian Product)是一个具有(p+q)个属性的集合,每一个元组的前p个属性来自R的一个元组,后q个属性来自S的一个元组。广义笛卡尔积记为RS,定义如下:,注意: RS有mn个元组,其中 R 为关系名,逻辑表达式 F(t)表示条件,F(t)中的运算符包括、=、及算术表达符,运算对象可以是属性名,常量等。由此可见,选择操作实际上是从关系中选取使条件 F(t)为真的元组组成新的关系 ,它是从行的角度进行的操作。,2 专门的关系操作,它包括:选择、
21、投影、连接、自然连接、除法,(1)选择操作(Selection) 选择操作是从关系中选择满足条件的元组组成一个新关系。选择操作用下式表示:,F,(R) =,(2)投影操作(Project),投影操作是对关系作垂直分解。 从关系的属性中选择属性列,由这些属性列组成一个新关系。 若A为关系R中的属性列,投影操作表示为:,连接是从关系R和S的广义笛卡尔积中选取属性值之间满足某一 运算的元组,记为,(3)连接操作(Join),其中 i 表示关系R第i个属性,j表示关系S中第j个属性,是算术 比较符。 连接的形式定义如下:,其中p是关系R的属性个数。,第(p+j)个属性满足运算的元组。如果是等号“=”
22、那么这个连接操作称为“等值连接”。,在R 和S的广义笛卡尔积中挑选第i个属性和,自然连接是一种特殊的等值连接,它要求两个关系中进行比较的属性必须是相同的属性列,并且在结果中把重名的属性列去掉。即若关系R和S具有相同的属性列B,则自然连接记作:,(4)自然连接(naturaljoin ),R S =,其中 是从关系S中去掉B属性列的元组。,设有关系R(x,y)和S(y),x和y为属性列,且S(y),则除法操作(Division)可记为:,(5)除法操作,RS=,以上9种关系代数操作,其中并、差,广义笛卡尔积、投影和选择5种操作称为基本操作,它们可以组成关系代数的完备操作集。其他操作(如交、连接和
23、除法)均可以用这5种基本操作来表达。,3. 关系代数操作的应用实例,6.2.5 关系数据库标准语言SQL,数据库语言:数据库管理系统配置,使用户可以对数据库进行各式各样的操作,构成用户和数据库的接口的语言。 由于DBMS所提供的语言一般局限于对数据库的操作,不同于计算机的程序设计语言,因而称它为数据库语言。 关系数据库语言是一种非过程语言。 SQL(Structured Query Language):一种基于关系代数和关系演算之间的语言,非过程语言是有别于过程语言的,即对用户而言只要说明“做什么”,指出需要何类数据,至于“如何做”才能获得这些数据的过程,则不必要求用户说明,而由系统来实现。,
24、SQL数据库具有三级体系结构。在SQL中,逻辑模式对应于基本表(Base Table),存储模式对应于存储文件,用户模式主要对应于视图 (View),元组称为“行”,属性称为“列”。,1 SQL 数据库的体系结构,SQL数据库的体系结构,2 SQL数据定义,SQL提供数据定义语言(DDL),它包括: 定义基本表 修改基本表 删除基本表 建立和删除索引 建立和删除视图 等。 定义基本表的SQL语句表示为: CREATE TABLE (列名数据类型完整性约束条件,) 表示可含有该子句,也可为空,视实际定义要求而定。 是所要定义的基本表名字。 定义基本表时要指明每个列的类型和长度,同时还可以定义与该
25、表有关的完整性约束条件。这些完整性约束与基本表的定义内容一并被存入系统的数据字典中,当用户操作基本表中的数据时,由DBMS自动检查该操作是否违背这些完整性约束条件。,数据库查询是数据库的核心操作。 SQL语言提供了SELECT语句进行数据库查询。 SELECT查询语句简单的形式为: SELECT A1,A2,An (指出目标表的列名或列表达式序列) FROM R1,R2,Rm (指出基本表或视图序列) WHERE F (F为条件表达式) GROUP BY 列名序列 (结果表分组) ORDER BY 列名排序方向 (结果表排序),3 SQL的数据查询,它可将一个记录插入到指定的表中。语句格式为:
26、 INSERT INTO (,) VALUES(,),4 SQL的数据更新,(1)插入语句( INSERT),UPDATE SET , WHERE ,(2)修改语句(UPDATE),修改语句可对指定表中已有数据进行修改。语句格式如下:,(3)删除数据( DELETE ),SQL删除语句的格式为:,DELETE FROM WHERE ,该语句的功能是从指定表中删除满足WHERE子句条件的记录。 如果省略WHERE子句,则删除表中所有记录。 注意:仅删除表中记录,表的定义仍在数据字典中。,视图是DBMS所提供的一种以用户模式观察数据库中数据的重要机制。 视图可由基本表或其他视图导出。 视图只是一个
27、虚表。,5 SQL的视图,SQL语言用CREATE VIEW语句建立视图,其一般格式为: CREATE VIEW 视图名 AS SQL-查询语句,视图定义后,用户就可以象对基本表操作一样对视图进行查询,6.2.6 数据库控制,数据库的破坏可能来自4个方面,数据库控制:DBMS对不同的情况,在技术上采取不同的解决措施,使得数据库中的数据安全可靠,正确有效,以保证整个数据库系统的正常运转。 有时也称“数据库保护”。,安全性控制 并发控制 数据库的恢复和 完整性控制,数据库控制通过4个方面的技术来实现:,安全性指保护数据库以防止不合法的使用所造成的数据泄露、修改或破坏。在数据库系统中,安全措施是逐级
28、设置的。主要技术有:,1 数据库的安全性,(1)用户标识与鉴别 (2)访问控制 (3)审计功能 (4)数据加密 (5)视图的保护,2 数据库的备份和恢复,转储指把数据库中的数据定期地从数据库卸出并写到系统的后备文件中作为备份。 日志技术指利用日志文件记录对数据库的每次修改操作的信息,当系统出现故障时,利用备份和日志信息来恢复系统。,由于计算机系统的硬件故障、软件故障、操作员的误操作以及恶意入侵都会破坏数据库中数据的正确性。为了使数据库系统在出现故障后,能迅速恢复(Recovery)系统,大多数数据库管理系统采用转储和日志技术。,恢复工作由DBMS的恢复子系统执行,其目的是把数据库从因故障而发生
29、的破坏或不正确的状态,恢复到最近的一个正确状态。 数据库恢复的基本机制就是“冗余”,即用备份来对数据库数据重复存储,3 数据库的完整性,数据库的完整性是指数据库中数据应始终保持正确的状态,防止不符合语义的错误数据输入,以及无效操作所造成的错误结果。 为了维护数据库的完整性,DBMS必须提供一种机制来检查数据库中的数据,看其是否满足语义规定的条件。这些加在数据库上的语义条件称为完整性约束(Integrity Constraints),它们作为模式的一部分存入数据库数据字典中。 可用SQL的断言(Assertions)来编写完整性规则。,4 数据库的并发控制,在多用户共享数据库系统中,多个事务可能
30、同时对同一数据进行操作,这就不可避免地发生冲突。 DBMS的并发控制(Concurrency Control)子系统负责协调并发事务的执行,保证数据库的完整性不受破坏,同时避免用户得到不正确的数据。 调度的原则是:既要交叉分时执行,以充分利用系统资源,又要避免访问冲突,以保证多事务存取共享数据库的正确性。,6.2.7 数据库系统及应用新技术,(1)关系型DBMS的应用 目前流行的数据库管理系统绝大多数是关系型DBMS。一般可分为如下3类: 以微型计算机系统为运行环境的数据库管理系统(如dBASE、FoxBASE、FoxPro等)。这类系统支持一般事务处理功能,特别强调使用的方便性和操作的简便性
31、。 主流关系数据库管理系统(如ORACLE、DB2、Sybase等)。这类系统更强调数据管理在理论上和实践上的完备性、具有完善的数据存储和管理能力、提供了比第类系统更全面的数据保护和恢复功能,它更有利于支持全局性的数据管理工作。 介于以上两类之间的关系数据库管理系统,如Microsoft SQL server等。,1 数据库与面向对象技术的结合,(2)面向对象数据库管理系统, 关系模型的不足 为了克服关系数据库的弱点,人们抓住了数据模型这一本质问题进行了研究,并认为根据各种不同的需要,应提供一种可扩充的数据模型,在此基础上由用户按需要定义新的数据类型及相应的操作和约束。面向对象数据模型就是这种
32、理想的可扩充数据模型之一。, 面向对象数据库管理系统 一般而言,一个以面向对象模型为基础的数据库管理系统应具备如下的基本内容和特征: 在数据模型方面支持对象、封装、类、继承、重载、联编、多态性等基本概念。 数据库访问界面要支持消息传递,提供计算能力完备的数据库语言,适合在分布式环境下工作。 提供类似SQL的非过程化查询功能。,(1)数据库系统体系结构的发展,2 数据库体系结构的发展,DBMS的系统结构随着硬件和软件支撑环境的变化而不断变化。,(2)分布式数据库 (3)并行数据库系统, 集中式数据库系统 客户/服务器结构 Internet上的Web数据库, 集中式数据库系统,早期的DBMS以分时
33、操作系统作为运行环境,采用集中式的数据库系统结构,把数据库建立在本单位的主计算机上,且不与其他计算机系统进行数据交互。用户通过本地终端或远程终端访问数据库系统。 在这种系统中,不但数据是集中的,数据的管理也是集中的。,在网络环境下的共享数据资源的数据库服务器结构。在这种两层结构中有多台用作客户机的计算机和一至多台用作数据库服务器的计算机。客户机直接面向用户,接收并处理任务,将其中需要对数据库操作的任务委托数据库服务器执行;而数据库服务器只接收客户机的这种委托请求,完成对数据库的查询和更新,并把查询结果返回给客户机。,具有C/S结构的数据库系统虽然处理上是分布的,但数据却是集中的,还是属于集中式
34、数据库系统, 客户/服务器结构, Internet上的Web数据库,客户端使用一个通用的浏览器,用户的所有操作都是通过浏览器进行的。B/S结构的核心部分是Web服务器,它负责接受远程(或本地)的HTTP查询请求,然后根据查询的条件通过数据库服务器获取相关的数据,再将结果翻译成HTML和各种 页面描述语言,传送回 提出查询请求的浏览器。 同样,浏览器也会将更 改、删除、新增数据记 录的申请传送到Web服务 器,由后者与数据库服 务器联系完成这些操作。,这种结构又称B/S结构。它由Web浏览器、Web服务器、数据库服务器三个层次组成。,(2)分布式数据库,在分布式数据库系统中,把一个单位的数据按其
35、来源和用途,合理分布在系统的多个地理位置不同的计算机结点上(局部数据库),使大部分数据可以就近存取。数据在物理上分布后,由系统统一管理。此时,系统中每个地理位置上的结点实际上是一个独立的数据库系统,它包括本地结点用户、本地DBMS和应用软件(称为结点自治性)。,在这种分布式数据库系统中,又强调各个结点之间的协调工作,使得任何一个结点上的用户都可以通过网络对其他结点数据库上的数据进行访问,就如同这些数据都存储在自己所在的结点数据库上一样。可以把分布式数据库系统看成是各个结点上局部DBMS的一种合作,但在每个结点上必须增加新的软件成分,使与系统中其他结点提供合作功能,这种新的成分与本地原有的DBM
36、S结合在一起,就构成了分布式数据库管理系统(DDBMS)。,(3)并行数据库系统,计算机并行系统通过并行地使用多个计算机的CPU和磁盘,可提高处理速度和IO速度。将这种并行系统处理技术应用于数据库中,对数据库处理效率的提高是十分显著的。 并行处理技术很适宜与关系数据库技术相结合,这是因为:,并行数据库系统(Parallel Database)的发展,在很大程度上提高了系统的性能,因此得到了广泛的应用。,在关系数据模型中,数据库二维表是元组的集合,数据库操作也是集合操作; 在许多情况下对集合的操作可分解为一系列对子集的操作,这些子集操作存在很好的并行性。,3 几种专用数据库介绍,(1) 工程数据
37、库 (2) 空间数据库 (3) 多媒体数据库 (4) 模糊数据库 (5) 主动数据库,(1)用于决策支持的数据仓库,4 数据库技术对决策应用的支持, 决策对数据的需要,(2)数据挖掘, 数据仓库,6.3 信息系统开发与管理,6.3.1 计算机信息系统,6.3.5 系统实施,6.3.3 系统分析,6.3.4 系统设计,6.3.6 系统运行和维护,6.3.2 系统规划,信息系统的开发和管理是一项系统工程,也是涉及多学科的综合技术。信息系统开发周期长、投资大、风险大,比一般技术工程有更大的难度和复杂性。对于从事信息系统分析、设计和管理的有关人员而言,应该掌握的知识是多方面的。,其中主要包括 : 软件
38、工程技术 数据库设计技术 程序设计方法 应用领域的业务知识 对应用环境深入的了解,6.3.1 计算机信息系统,软件危机 :大型软件系统开发成本高,可靠性差,甚至有时人们无法管理自身所创造出来的这个复杂逻辑系统,致使软件的生产和维护出现了很大的困难,当时人们称此为“软件危机”。,程序是根据算法用某种计算机语言编写的语句的集合 而软件是程序再加上程序实现和维护系统时所必需文档的总称。,(1) 对软件需求分析的重要性认识不够 (2) 软件不是物理产品而是一种逻辑产品 (3) 问题的复杂度增加,软件危机产生的主要原因有三个:,1 软件危机和软件工程,软件工程(Software Engineering)
39、 以工程化的方式组织软件开发。,2 软件工程方法要点,软件开发技术 软件工程管理 软件开发方法 软件开发工具,必须强调以下几点:,(1)结构化生命周期方法 (2)原型法 (3)面向对象开发设计方法 (4)CASE方法,3 信息系统开发方法,结构化方法将信息系统软件生命分为5个阶段:,系统规划 系统分析 系统设计 系统实施 系统维护,结构化生命周期方法,在结构化生命周期法开发信息系统的过程中,特别强调结构化的分析和设计原则。其基本思想是: 采用自顶向下,逐层分解、逐步求精的方法分析和设计整个系统,可以有效地减小和控制系统开发的复杂性。 自顶向下,将系统划分为若干个既相对独立又相互关联的具有层次性
40、的模块,而整体系统是这些模块的集成。 采用图示工具(如数据流程图和E_R图等)描述分析和设计的内容,便于系统开发过程中各类人员(包括用户)之间的相互交流。 明确系统开发的各个阶段的任务。 强调用户参予系统分析与系统设计过程的作用。,是指由系统分析设计人员与用户合作,在短期内定义用户基本需求的基础上,首先开发出一个具备基本功能、实验性的、简易的应用软件。然后运行这个原型,并在相应的辅助开发工具的支持下,按照不断求优的设计思想,通过反复的完善性实验而最终开发出符合用户要求的信息系统。,原型法(Prototyping Approach),面向对象技术在需求分析、可维护性和可靠性这三个软件开发的关键环
41、节和质量指标上,较之其他方法均有实质性的突破。,面向对象开发设计方法,是一种自底向上和自顶向下相结合的方法,它以对象建模为基础,建立系统所有对象的数据结构。,面向对象方法(Object-Oriented Modeling,简称OOM),CASE方法,CASE(Computer Aided Software Engineering)是一种自动化或半自动化的方法,可以全面支持除系统规划外的每一个开发阶段的工作,它是1980年代末从计算机辅助编程工具、第四代程序设计语言(4GC)及绘图工具发展而来的。 采用CASE工具进行系统开发,必须结合一种具体的开发方法(如以上介绍的3种开发方法),CASE可为
42、它们提供支持各个开发过程的专门工具。 实际上是把原先由手工完成的开发过程转变为使用自动化工具和支撑环境的开发过程。, 数据库设计的任务 数据库设计的基本任务是根据一个单位或部门的信息需求、处理需求和数据库的支持环境(包括硬件、操作系统和DBMS),设计出数据模式(包括用户模式、逻辑模式和存储模式)以及相应的应用程序。 信息需求表示一个单位所需要的数据及其结构,处理需求表示一个单位经常需要进行的数据处理功能。前者表达了对数据库的内容及结构的要求(静态),后者表达了基于数据库的数据处理要求(动态)。, 数据库设计概要,(1)数据库设计的任务和方法,面向过程的设计方法 以处理需求为主,兼顾信息需求。
43、又称过程驱动的设计方法 面向数据的设计方法 以信息需求为主,兼顾处理需求。又称数据驱动的设计方法, 数据库设计的方法,(2)数据库设计步骤,在信息系统开发中必须把数据模式设计和对数据处理的程序模块设计紧密相结合。事实上,在各个开发阶段这两方面所做的需求分析、设计和实现工作是同步进行的,且需要相互参照,相互补充。,(3)数据库设计描述工具,6.3.2 系统规划,1 系统规划的任务,对应用单位的环境、目标、现行系统的状况进行初步调查,根据单位发展目标和战略对建设新系统的需求做出分析和预测,同时考虑建设新系统所受的各种约束,研究实施新系统的必要性和可能性,给出拟建系统的初步方案和项目开发计划,并对这
44、些方案和计划分别从管理、技术、经济和社会等方面进行可行性分析,写出可行性报告。,(1)以应用单位的发展目标和战略作为系统规划的出发点,分析该单位管理的信息需求,明确信息系统的战略目标和总体结构。 (2)用户参予。即由使用单位的有关人员和设计部门的系统规划人员共同合作,以便分析问题,研讨解决方案。 (3)信息系统结构要有良好的整体性。 (4)便于实现。方案选择强调实用和实效,技术手段强调成熟和先进,计划安排强调合理和可行。,2 系统规划的原则,信息系统的规划和实现过程是“自顶向下规划分析,自底向上设计实现”过程的前期工作。采用自顶向下的规划方法,可以保证系统结构的整体性和信息需求的一致性。,6.
45、3.3 系统分析,系统分析即需求分析,它是研制信息系统最重要的阶段,也是最基础的阶段。实践表明,系统分析工作的好坏,在很大程度上决定了信息系统的成败。,系统分析,系统分析是采用系统工程的思想和方法,把复杂的对象分解成简单的组成部分,提出这些部分所需数据的基本属性和彼此间的关系。,需求分析的重点是“数据”和“处理”,通过调研和分析,应获得用户对数据库的基本要求。即: (1) 信息需求,指用户需要从数据库中获得信息的内容和性质,由此导出数据要求,即在数据库中所需存储的数据。 (2) 处理需求,指出用户要求系统完成的处理功能,处理时间以及处理方式。 (3) 安全与完整性的要求。,1 系统分析的任务,
46、在系统分析中经常使用结构化分析方法(Strucured Analysis,简称SA)。SA方法从最上层的组织机构入手,采用自顶向下逐层分解的方法分析系统,并用形式化或半形式化的描述(如数据流程图和数据字典)来表达数据和处理过程的关系。,2 系统分析的方法, 数据流程图(Data Flow Diagram,简称DFD)是使用直观的图形符号,描述系统业务过程、信息流和数据要求的工具。表达了数据和处理的关系, 数据字典。数据字典(DD)则是系统中各类数据定义和描述的集合,是进行详细的数据分析所获得的主要成果。,在数据字典中对数据流程图中的数据项、数据结构、数据流、处理逻辑、数据存储和外部实体等6个方
47、面进行定义。,数据字典是关于数据库中数据的描述,即元数据,而不是数据本身。 数据字典是系统开发的一项重要的基础工作,它在需求分析阶段建立,在数据库设计过程中不断修改、充实、完善。 数据字典可存储在计算机中,并可用一个数据字典软件来管理。,6.3.4 系统设计,系统分析阶段要明确系统功能,其成果是关于新系统的实现目标。 系统设计阶段要为实现系统目标具体规定数据结构和系统功能。,概述,系统设计的内容根据系统目标和处理的不同而各不相同。一般而言,它是从新信息系统的目标出发, 建立系统的数据模型和功能模型, 确定系统的总体结构, 规划系统规模, 确立模块结构并说明它们在整体系统中的作用及相互关系, 选择必要的设备, 采用合适的技术规范,,,以保证总体目标的实现。, 系统性 灵活性 可靠性 经济性,系统设计中应遵循的设计原则,开发一个全局性的信息系统,由于其问题的复杂性,在系统规划和需求分析阶段一般采用自顶向下的方法。而在概念结构设计中则采用自底向上的方法,即首先定义各局部应用的概念结构,然后将它集成起来得到全局的概念结构。,概念结构设计,概念结构设计: 将需求分析得到的用户需求抽象为概念模型的过程。,(1)概念结构设计的方法和步骤,由于E-R模型易于理解、易更改且能真实充分反映
链接地址:https://www.31doc.com/p-2646745.html