欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PDF文档下载
     

    元数据管理模块方案.pdf

    • 资源ID:4958188       资源大小:879.72KB        全文页数:10页
    • 资源格式: PDF        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    元数据管理模块方案.pdf

    1 目录 1. 现状分析 . 2 1.1 目前的困境 . 2 1.2 什么是元数据管理 . 3 2. 目标分析 . 3 2.1 建立完善的指标解释体系 . 3 2.2 建立规范的元数据管理体系. 4 2.3 建立有效的数据稽核体系 . 4 3. 功能概述 . 4 3.1 元数据管理 . 4 3.1.1 业务元数据 5 3.2.2 技术元数据 6 3.3 元数据分析 9 3.3.1 血统分析 9 3.3.2 影响分析 10 3.3.3 重要性分析 11 3.3.4 无关性分析 12 3.4 数据稽核 12 3.4.1 稽核规则管理 13 3.4.2 稽核任务调度 13 3.4.3 稽核结果分析 14 3.4.4 数据质量评估 14 3.4.5 数据问题管理 14 2 元数据管理系统概述 1. 现状分析 随着经营分析系统规模不断扩大,系统所积累数据量也越来越大, 收集到的 海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难 度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管 理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统 中的数据质量。 如何对现有数据进行深层发掘, 并揭示出埋藏在元数据中的趋势、 因果关系、 关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解 决的头等大事。构建BI,首先要保证的是数据质量。元数据管理解决的问题就 是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关 系,为数据仓库的数据质量监控提供基础素材。 1.1 目前的困境 使用者 (决策层、业务分析人员 ): 1) 经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这 些指标往往不一致, 给业务分析和决策工作造成很多困惑,必须花费很大的 精力去检查核实。 2) 对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具 体算法和来龙去脉。 数据仓库项目开发维护者: 1) 不同报表中的同一指标不一致,必须花费很大的精力去检查,目前基本 上是通过手工检查表和存储过程的方式,效率较低。 2) 没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据 业务人员的需求制作完成之后, 往往没有整理完善相应的数据指标解释和元 数据管理,造成日后检查困难。 3) 开发、维护规范的执行力较低,没有行之有效的管控手段。不严格按照 3 规范执行,随着项目的发展和时间的推移,导致数据仓库项目的健壮性和可 维护性呈几何级数下降,给数据仓库的建设带来大量的重复工作。 1.2 什么是元数据管理 元数据最本质,最抽象的定义为:data about data ( 关于数据的数据 )。 而对于经营分析数据仓库而言, 形象的定义为:元数据就是数据仓库的规范。 这些规范包括对各种指标的定义、解释;包括对各表中数据的来龙去脉、数 据的大小和格式的定义。 元数据管理,就是要建立一套行之有效的规范以及该规范的管控体系, 实现从管理到查询到综合分析的全面管控,管理层次从接口到ETL 处理、 业务逻辑处理、 结果展现处理和指标分析的方方面面,构成数据仓库应用系 统的核心和基础。做到开发者能严格遵守规范, 维护者和使用者有规范可查, 有力的保障数据仓库项目的健壮性和可维护性。 2. 目标分析 要走出目前的困境,有下面三个方面的问题急待解决: 2.1 建立完善的指标解释体系 满足用户对业务和数据理解的需求, 建立标准的企业内部知识传承的信 息承载平台,建立业务分析知识库, 实现知识共享。 能够回答诸如以下问题: 什么是出帐用户数? 在网用户数和网上用户数有何区别? 什么是套餐的生命周期? 竞争对手新发展用户数是怎么得来的? 这个数据还叫什么名字? 4 2.2 建立规范的元数据管理体系 让用户能够清晰的了解数据仓库中数据流的来龙去脉,业务处理规则、 发展情况等,提高系统的可维护性、适应性和集成性,支持数据仓库/集市 的成长需求,减少因员工换岗造成的影响。 具体来讲,主要是对数据仓库建设、 运行和维护的规范的管理。 能够回 答诸如以下的问题: 哪张表是从业务系统抽取过来的原始话单表? 竞争对手新发展用户事实表中的数据,是从哪些表汇总计算出来的? DW 用户下的 P_XXX 这个存储过程是谁写的,现在还有用吗? 我是新手,要生成套餐生命周期演化分析事实表,我该怎么做? 表空间不够了,哪些表的数据可以删掉? 2.3 建立有效的数据稽核体系 促进数据仓库的数据质量建设, 为提高整个系统的数据质量奠定坚实的 基础。建立报警、监控机制,出现故障,能及时发现问题。提供整体系统运 营的情况分析。能够回答诸如以下问题: 今天的出帐用户数过高,是怎么回事? 数据集市层中的DM_XXX 表中数据为空,什么原因? A 报表中的全省 ARPU 值和 B 报表中的 ARPU 值为什么不同? 3. 功能概述 3.1 元数据管理 对数据仓库的层次结构、主题域划分,各层的各种对象,如表、存储过 程、索引、数据链、函数和包等的管理。能够清晰的展现各层次结构之间的 数据流程,图形化展现各对象之间的关系,展现表中数据的来龙去脉。 5 3.1.1 业务元数据 业务元数据包括以下信息: 使用者的业务术语所表达的数据模型、对象 名和属性名;访问数据的原则和数据来源;系统所提供的分析方法及公式、 报表信息。 业务元数据管理除了管理上述信息外, 还提供对业务元数据来源的管理 和差异性对比功能,使用户能够方便的查询、比较和追溯。 包括两个子模块, 指标管理 和指标解释接口 。 指标管理 :主要实现对所有指标的维护功能,维护指标的基本信息、 业 务规则和技术算法等。 能够展现各个主题分析中的指标,以及指标间的区别 等信息。 指标解释接口 :提供统一的接口,使用户能够在经营分析系统或CRM 系统中,点击任一指标名称,即可查看该指标的详细描述和解释说明。 6 3.2.2 技术元数据 技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管 理数据仓库的数据, 主要包括数据仓库结构的描述 (各个主题的定义, 星型 模式或雪花型模式的描述定义等) 、 ODS 层 (操作数据存储 ODS .Operation Data Storage) 的企业数据模型描述(以描述关系表及其关联关系为形式)、 对数据稽核规则的定义、 数据集市定义描述与装载描述 (包括 Cube 的维度、 层次、度量以及相应事实表、概要表的抽取规则)。 系统除了维护技术员数据的基本信息外,更以图形的方式展现和管理各 技术元数据之间的关联关系和来源。 技术元数据管理主要包括以下几个功能模块: 元数据查询 :按关键字、分类、主题域名称等维度进行查询,展现该元 数据的基本信息,如业务描述、技术描述、计量单位、所属分类等信息。 元数据维护 :对元数据的基本信息进行维护,包括增、删、改。 7 元数据关系查询 :展现元数据之间的关系, 如:按经营分析数据仓库的 各个层次进行展现; 按元数据之间的映射关系展现;按元数据的处理流程进 行展现等等。 8 元数据关系管理 :对元数据关系进行维护,包括增加、删除和修改。 如上图所示,鼠标右键点击某个节点,对该节点进行增、删、改操作。 9 3.3 元数据分析 血统分析、影响分析、表重要程度分析、表无关程度分析等等。通过上 述分析,让用户对整个数据仓库总体上有清晰的认识和理解,解决数据孤岛 的问题。 3.3.1 血统分析 数据血统 Data Lineage ,通过数据血统分析, 用户可以知道数据何时 更新、如何计算以及从何处而来, 所有这些手段帮助用户追溯报表中数据产 生的来源。这种深入洞查数据来龙去脉的能力对于帮助用户更加信赖他们的 信息来说,具有至关重要的作用。 10 移动大客户信息展现移动新入网用户信息展现 数据集市 DM 层 数据仓库 DW 层 ODS 层 源数据 SRC 层 业务生产系统 营帐系统话单表 ETL 抽取话单 联通用户通话详单 从详单中抽取与移动用户的通话记录 移动用户通话详单表 与移动在网用户比较沉淀话务指标 移动用户话务表移动新入网用户表 汇总产生大客户信息汇总产生新入网用户信息 3.3.2 影响分析 影响分析关注的重点是数据的流向,提供端对端影响分析, 使您能够看 见源系统发生变化时, BI 报表受到的影响,而因此可以轻松地处理BI 环境 中的变化。

    注意事项

    本文(元数据管理模块方案.pdf)为本站会员(tbuqq)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开