第四讲决策支持的新技术.ppt
《第四讲决策支持的新技术.ppt》由会员分享,可在线阅读,更多相关《第四讲决策支持的新技术.ppt(54页珍藏版)》请在三一文库上搜索。
1、第四讲 决策支持的新技术,第一节 数据仓库技术,4.1.1 数据仓库的基本知识 4.1.2 数据仓库系统的结构 4.1.3 数据仓库的运行结构 4.1.4 数据集市的结构,第二节 数据挖掘技术,4.2.1 数据挖掘概述 4.2.2 数据挖掘基本过程与步骤 4.2.3 数据挖掘的任务与挖掘方法 4.2.4 数据挖掘与数据仓库的关系,第三节 联机分析处理技术,4.3.1 基本概念 4.3.2 OLAP的数据组织 4.3.3 OLAP的多维数据分析方法 4.3.4 OLAP的发展,4.1.1 数据仓库的基本知识,一.从数据库到数据仓库,事务处理环境不适宜决策应用的主要原因: 1.事务处理环境和分析处
2、理的性能、特性不同 2.数据集成问题 3.数据动态集成问题 4.历史数据问题 5.数据的综合问题 6.不同的使用对象,4.1.1 数据仓库的基本知识,二.数据仓库的概念 1.W.H.Inmon,是面向主题的、集成的、稳定的、随时间变化的数据集合,用于支持经营管理中的决策制定过程。 面向主题 集成 稳定 随时间变化,2.SAS软件研究所的观点,3.DW是作为DSS的基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需的信息。 4.DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的,即与企业定义的时间段相关的、面向主题且不可更新的数据集合。 5.,三.数据仓库的特点,1.
3、数据仓库是面向主题的。,2. 数据仓库是集成的。,3.数据仓库是稳定的。,4.数据仓库是随时间变化的。,5.数据仓库中的数据量很大。,6.数据仓库软硬件要求较高。,四.数据库与数据仓库的区别,1.数据库是面向业务的,使用者是企业的一般业务人员,进行企业日常数据处理和维护工作。 2.数据仓库是面向决策的,使用者是企业的高层管理人员,它也是使用关系数据库,当数据仓库不负责处理业务。 3.数据库注重的是企业运行的当前数据,任务是收集和记录企业的原始业务数据,而DW面对的是非即时性的历史数据,通过从业务数据中提取,加工处理后提供给决策人员。,4.1.2 数据仓库系统的结构,一.数据仓库管理系统 1.定
4、义部件 2.数据获取部件 3.管理部件 4.目录部件(元数据) 5.DBMS部件,二.数据仓库的结构构成 1.数据仓库的构成,二.数据仓库的结构构成 2.数据仓库的元数据,(1)关于数据源的元数据,数据源中所有的物理数据结构,包括所有的数据项和数据类型; 所有数据项的业务定义; 每个数据项更新频率,以及由谁或哪个过程更新的说明; 每个数据项的有效值; 其他系统中具有相同业务含义的数据项的清单。,2.数据仓库的元数据,(2)关于数据模型的元数据,I/O对象:支持数据仓库I/O操作的各种对象; 关系:两个I/O对象之间的关联; 关系成员:描述每个关系中两个I/O对象的具体角色、关系度以及约束条件;
5、 关系关键字:描述两个I/O对象如何建立关联。,2.数据仓库的元数据,(3)关于数据仓库映射的元数据,用该类元数据反映数据仓库中的数据项是从哪个特定数据源填充的,经过哪些转换、变换和加载过程。 这类数据可以用来生成程序,以完成数据的转换工作,即实现操作型数据转换为面向主体的数据仓库的数据。,2.数据仓库的元数据,(4)关于数据仓库使用的元数据,元数据告诉数据仓库中有什么数据,它们是从哪儿来的,即如何按主题查看数据仓库的内容; 元数据提供已有的可重复利用的查询语言信息。,2.数据仓库的元数据,(5)元数据的作用DW的核心,定位数据仓库的目录作用; 数据从业务环境向数据仓库传送时数据的目录内容;
6、指导从当前基本数据到轻度综合数据、轻度综合数据到高度综合数据的综合算法的选择。,三.数据仓库的工具集 1.分析工具 (1)查询工具 (2)可视化工具 2.挖掘工具,四.数据进入DW的过程与建立DW的步骤 1.数据进入DW的基本过程(教材p221),提取:从操作型数据库中选择并提取所需要的字段; 变换:为来自数据源的数据指定常用的格式和名称; 净化:更正错误的数据; 加载:把净化过的数据载入到DW数据里; 汇总:提前计算出任何期待的DW数据的汇总供以后使用。,2.建立DW的步骤,收集和分析业务需求 建立数据模型和数据仓库的物理设计(包括划分粒度和数据分割两部分内容) 定义数据源 选择DW技术和平
7、台 从操作型DB中提取、转换、净化并加载到DW中 选择访问和报表工具 选择DB连接软件 选择数据分析和数据展示软件 更新DW,4.1.3 数据仓库的运行结构,两层C/S结构:,三层C/S结构:,4.1.4 数据集市的结构,一.数据集市的概念,数据集市是指具有特定应用的数据仓库,主要针对某个具体战略意义的应用或具体部门级的应用,支持用户利用已有的数据获得重要的竞争优势或找到进入新市场的具体解决方案。,二.数据集市的特点,1.规模是小的; 2.特定的应用; 3.面向部门; 4.由业务部门定义、设计、开发、管理和维护; 5.快速实现; 6.购买较便宜; 7.投资快速回收; 8.工具集的紧密集成; 9
8、.更详细的、预先存在的数据仓库的摘要子集; 10.可升级到完整的数据仓库。,各个数据集市之间对详细数据和历史数据的存储存在大量冗余; 同一个问题在不同的数据集市的查询结果可能不一致,甚至相互矛盾; 各数据集市之间以及与源数据库系统之间难以管理。,2.数据仓库与数据集市的区别,(1)DW是基于整个企业的数据模型建立的,它面向企业范围内的主题,而数据集市是按照某一特定部门的数据模型建立的,也称为部门级别DW。 (2)数据仓库中存储整个企业内的详细数据,而数据集市中的数据的详细程度要低一些,包含的概要和累加数据要多一些。 (3)数据集市的数据组织一般采用星形模型,而大型数据仓库的数据组织采用第三范式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 决策 支持 新技术
链接地址:https://www.31doc.com/p-3029818.html