中国移动通信企业标准.doc
《中国移动通信企业标准.doc》由会员分享,可在线阅读,更多相关《中国移动通信企业标准.doc(80页珍藏版)》请在三一文库上搜索。
1、QB-中国移动通信企业标准QB-Y-XXX-2010中国移动省级NG2-BASS技术规范数据质量管理子系统分册The Technical Specification Fascicule for Data Quality Management Subsystem of New Generation Business Analysis Support System 版本号:3.0.02010-实施2010-XX-发布中国移动通信集团公司 发布QB-Y-XXX-2010目录1.范围62.规范性引用文件63.术语、定义和缩略语64.总体说明84.1.概述84.2.系统建设目标94.3.数据质量问题域9
2、4.3.1.信息问题域104.3.2.技术问题域114.3.3.流程问题域124.3.4.管理问题域125.系统架构135.1.系统功能结构135.2.系统技术结构166.系统功能176.1.源系统变更协同管理176.1.1.管理范围186.1.2.受理接口196.1.3.任务管理226.2.数据质量监控236.2.1.数据采集236.2.1.1.数据采集范围236.2.1.2.数据采集功能要求246.2.2.源系统关键数据稽核246.2.2.1.源接口文件级及记录级检查246.2.2.2.源接口关键字段波动稽核256.2.2.3.源系统关键指标比对256.2.2.4.源接口一经校验规则计算2
3、66.2.3.源系统维表稽核276.2.3.1.维表变更监控286.2.3.2.维表映射关系稽核296.2.3.3.维表引用有效性稽核306.2.4.数据实体检查316.2.5.处理过程检查326.2.6.关键指标检查326.2.6.1.指标波动检查336.2.6.2.指标平衡性检查336.2.6.3.指标加权波动检查346.2.7.告警管理356.2.7.1.告警的分类和分级356.2.7.2.告警形式366.2.7.3.通用告警处理366.2.8.拓扑呈现386.2.8.1.拓扑呈现的分类386.2.8.2.拓扑呈现与元数据的关系396.2.8.3.拓扑呈现的功能396.2.9.规则配置4
4、06.3.数据质量问题处理416.3.1.数据质量问题要素416.3.2.模块间交互关系426.3.3.功能说明426.3.3.1.问题生成426.3.3.2.问题分析436.3.3.3.问题处理436.3.3.4.问题总结456.4.数据质量评估456.4.1.源接口基础数据质量评估466.4.1.1.评估指标466.4.1.2.评估方法476.4.1.3.评估报告476.4.1.4.评估应用476.4.2.经营分析系统指标关联性分析506.5.数据质量报告516.5.1.质量报告基本功能526.5.1.1.报告生成526.5.1.2.报告发布536.5.1.3.报告查询536.5.1.4.
5、报告归档536.5.2.报告分类546.5.2.1.源系统变更协同管理报告546.5.2.2.源系统核心数据稽核报告546.5.2.3.源系统维表稽核报告556.5.2.4.处理过程质量报告556.5.2.5.关键指标质量报告556.5.2.6.一经接口质量报告556.5.2.7.数据质量评估报告556.6.数据质量知识库566.6.1.数据质量知识的产生566.6.2.数据质量知识的应用566.6.3.内容组成与数据格式576.7.数据质量对外服务596.7.1.数据质量信息查询功能596.7.2.数据质量问题交互597.数据质量管理机制与流程607.1.数据质量管理机制607.1.1.组织
6、机构与职责607.1.2.角色与职责607.2.数据质量管理流程617.2.1.源系统变更协同管理流程617.2.1.1.流程进入条件637.2.1.2.流程产生文档637.2.2.经营分析系统需求变更控制流程637.2.2.1.流程进入条件647.2.2.2.流程产生的文档647.2.3.数据质量告警处理流程647.2.3.1.流程进入条件667.2.3.2.流程产生文档667.2.4.数据质量问题处理流程667.2.4.1.流程进入条件677.2.4.2.流程产生文档677.2.5.数据质量报告管理流程687.2.5.1.流程进入条件697.2.5.2.流程产生文档698.系统技术要求69
7、8.1.数据采集技术要求698.2.数据存储要求698.3.功能组件与对外交互要求698.4.监控检查技术要求708.5.控制台和对外服务接口技术要求708.6.数据质量监控其它实施要求709.编制历史72附录:工程实施指导75前言本标准的制订是为了构建省级经营分析系统数据质量管控体系,以及时发现、定位和解决省级经营分析系统的各类数据质量问题,确保数据质量的稳定可靠。数据质量管理子系统是经营分析系统数据管理域的重要子系统,负责对经营分析系统全流程数据质量进行监控和管理。本期规范在前期系统建设构建经营分析系统数据质量基础管理功能框架的基础上,通过源系统变更协同管理、数据质量监控与问题处理、数据质
8、量评估与报告、数据质量知识库和数据质量对外服务等功能进一步深化数据质量管控能力,构建从源系统到经营分析系统数据质量联动机制,全面提升数据质量管理子系统对数据质量管控的支撑能力。本标准主要包括以下几方面的内容总体说明、系统架构、系统功能要求、数据质量管理机制与流程和系统技术要求等。本标准由中移技2010 XX 号印发。本标准由中国移动通信集团公司业务支撑系统部提出,集团公司技术部归口。本标准起草单位:中国移动通信集团公司。本标准主要起草人:段云峰、何鸿凌、付峰、汪峰、尚晶、张韬、易剑光、杨秋雁、崔洪涛、陈涛、曾成、金骏、朱伟胜、秦晓飞、赵静、徐少飞、邓青、赵洪松、李倩、谢志崇、田长江、余疆、陶涛
9、肖建明、张红星、魏春辉。V1. 范围本标准规定了中国移动省级经营分析系统数据质量管理子系统的建设内容,供中国移动内部和厂商共同使用;适用于中国移动各省(直辖市、自治区)公司省级经营分析系统数据质量管理子系统的建设。2. 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。1QB-Y-XXX-2010中国移动省级NG2-BASS技术规范总册v3.0中国移动通信有限公司2QB-Y-X
10、XX-2010中国移动省级NG2-BASS技术规范元数据管理分册v3.0中国移动通信有限公司3. 术语、定义和缩略语下列术语、定义和缩略语适用于本标准:字母名词解释G工作流管理工作流管理是一种软件技术应用,它通过计算机语言实现工作流的定义,创建工作流实例,并按照预定义的工作流逻辑和流程规则推进工作流实例J经营分析门户经营分析门户是经营分析系统用户访问并使用经营分析系统各类应用的统一接入平台S数据采集点覆盖源系统和经营分析系统数据处理环节的,获取每个环节运行状态的实体。该实体可以是程序实体也可以是任务实体S数据质量检查点又称数据质量检测点,是指行使数据质量监控检查功能的实体。该实体可以是程序实体
11、也可以是任务实体S数据质量报告数据质量报告是对数据质量日常监控以及质量评估等过程累积的各种信息进行汇总、梳理、统计和分析,形成统计报告的过程S数据管理域数据管理域包括数据质量管理体系和运维管理两大部分。数据管理域依托元数据管理模块,完善数据质量监控应用和数据运维管理,逐步实现企业全程数据的监管和运维管理S数据质量知识库数据质量管理子系统存储层上的存储信息库,主要包括各种检查规则和检查结果报告(包括告警),以及数据质量问题的处理过程信息S数据质量监控自动获取经营分析系统各环节的数据质量信息,结合元数据库中的有关检查规则和采集规则,对数据质量情况进行诊断,并及时向数据质量监控人员报告S数据质量采集
12、代理(Agent)是指完成数据质量数据采集功能的实体。该实体是采集服务端(Server)相对应的S数据质量管理子系统数据质量管理子系统属于经营分析系统数据管理域中的 一个子系统,其功能是对经营分析系统数据质量进行监控、评估和数据质量问题处理S数据质量监控信息库数据质量管理子系统存储层上的存储结构,用于存储数据质量信息采集程序采集的数据质量信息、质量评估信息、问题解决方案和问题处理流程信息等。S数据质量评估数据质量评估由数据质量管理人员根据需要发起,依据评估指标和评估方法,源接口基础数据或指标进行评价,得到评估结果并作为系统质量改进的参考和依据。Y元数据元数据(Meta Data)泛指描述领域概
13、念(Domain Concepts)、领域关系(Domain Roles)、领域规则(Domain Rules)的数据。领域语义(Semantics)和知识(Knowledge)也属于元数据的范畴Y源系统变更协同管理源系统变更协同管理是获取源系统变更信息,调用元数据管理模块相关分析功能对源系统变更进行影响分析,对源系统变更进行事前管理。Z组件组件是实现特定功能的程序模块下列缩略语适用于本标准:缩写英文描述中文描述BOSSBusiness Operation Support System业务运营支撑系统DSMPData Service Management Platform数据业务管理平台ETL
14、Extraction Transformation Loading抽取、转换和加载ODSOperational Data Store操作型数据存储OLAPOn-line Analysis Process在线分析处理4. 总体说明数据质量管理子系统是经营分析系统数据管理域的重要组成部分。本章从数据质量概述、本期建设目标和数据质量问题域三个方面对数据质量管理子系统进行概要描述。4.1. 概述经营分析系统数据质量管理体系包括对数据源接口、数据实体、处理过程、数据应用和业务指标等相关内容的管控机制和处理流程,也包括对数据质量管控和处理的信息总结和知识应用等辅助内容。数据质量管理子系统是经营分析系统数据
15、质量管理体系的技术支撑平台。本规范用于指导省级经营分析系统数据质量管理子系统建设。本规范描述了经营分析系统数据质量管理的范围和要求,描述了数据质量管理体系结构,规定了数据质量管理子系统的基础功能和处理流程,强调了数据源端联动机制的构建,强调了数据质量评估、数据质量管控信息总结、知识沉淀和经验重用。本规范要求形成由源系统变更协同管理、数据质量监控、数据质量评估、数据质量报告和数据质量对外服务等功能构成的数据质量管理子系统,以及基于该子系统的数据质量管控流程和技术要求。数据质量管理子系统的相关分析和数据管理将引用元数据管理模块的功能,详见中国移动省级NG2-BASS技术规范元数据管理分册v3.0。
16、4.2. 系统建设目标NG2-BASS3.0规范数据质量管理子系统以“深化数据质量管控能力,构建源系统联动机制”为建设目标,具体包括:1. 实现对源系统变更的协同管理,通过对源系统变更的获取及影响分析,在数据质量管控基础上,强化事前管理,减少由源系统变更引起的数据质量问题,构建源系统联动机制。2. 建立有效的数据质量监控机制,在经营分析系统数据处理主要阶段设置数据质量检测点,实现源系统核心数据稽核、源系统维表稽核、数据实体检查、处理过程检查和关键指标检查,实现从源系统接口层到经营分析系统应用层的全流程数据质量监控,便于数据质量问题提前发现和及时处理。同时,管理在数据质量监控中产生的告警信息,并
17、集成元数据信息,实现拓扑呈现,提供经营分析系统数据处理状态和质量状况的全局视图。3. 加强数据质量评估,根据评估指标和评估方法,实现对系统源接口基础数据质量的评价,发现数据质量潜在的问题和规律,作为经营分析系统数据质量改进的参考和依据。4. 建立数据质量报告功能,实现对数据质量子系统各种信息的汇总、梳理、统计和分析,提供全面及时的数据质量报告,预防和控制错误范围的扩大,便于数据质量管控信息总结、知识沉淀和经验重用。4.3. 数据质量问题域经营分析系统数据质量问题按照来源和具体原因,可以分为信息、技术、流程和管理四个问题域,如图 41所示。图 41 数据质量的四个问题域4.3.1. 信息问题域信
18、息类问题是由于对数据本身的描述、理解及其度量标准偏差而造成的数据质量问题,如图 42所示。图 42 信息问题域产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量得不到保证和变化频度不恰当等。数据度量主要包括完整性、唯一性、一致性、准确性和合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。信息类问题中易引起描述及理解错误的元数据主要包括:l 业务元数据主要包括业务描述、业务规则、业务术语和业务指标口径等;l 技术元数据主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。4.3.2. 技术问题域技术类问题是指由于具体数据处理的各技术环节异常
19、而造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷,如图 43所示。图 43 技术问题域技术类数据质量问题主要产生在数据创建、数据获取、数据传递、数据装载、数据使用和数据维护等环节,具体描述如下:l 数据创建质量问题主要包括:业务系统话单延迟入库、创建数据默认值不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效和记录重复等;l 数据获取质量问题主要包括:采集点不正确、取数时间点不正确以及接口数据在获取过程中失真。如:编码转换处理错误或精度不够,导致指标统计结果不一致或数据无效等;l 数据传递质量问题主要包括:接口数据及时率低、接口数据漏传和网络传输过程不可靠,如包丢失、文
20、件传输方式错误、传输技术问题和协议使用不当导致的数据不完整等;l 数据装载质量问题主要包括:数据清洗算法、数据转换算法、数据加载算法的错误和调度机制不合理等;l 数据使用质量问题主要包括:展示工具使用错误、展示方式不合理和展示周期不合理等;l 数据维护质量问题主要包括:数据备份/恢复错误、数据的存储能力有限、维护过程缺乏验证机制和人为后台调整数据等。4.3.3. 流程问题域流程类问题是指由于系统作业流程和人工操作流程设置不当造成的数据质量问题,如图 44所示。图 44 流程问题域流程类问题主要来源于经营分析系统的数据创建流程、数据传递流程、数据装载流程、数据使用流程、数据维护流程和稽核流程等各
21、环节,具体描述如下:l 数据创建流程质量问题主要指操作员数据录入时缺乏审核流程;l 数据传递流程质量问题主要指通信流程沟通不畅;l 数据装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;l 数据使用流程质量问题主要指数据使用流程缺乏流程管理;l 数据维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;l 稽核流程质量问题主要指缺乏数据检查及问题反馈流程。4.3.4. 管理问题域管理类问题是指由于人员素质及管理机制方面的原因造成的数据质量问题,如图 45所示。图 45 管理问
22、题域管理类问题主要包括人员的管理、培训和激励等方面的措施不当导致的管理缺失。人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划;人员管理所产生的质量问题主要指缺乏管理目标、责任人缺失或有关人员缺乏责任心和工作的优先级安排不当;人员激励所产生的质量问题主要指缺乏奖惩制度、奖惩制度的执行不到位、激励反馈渠道不畅和缺乏反馈机制。以上四类数据质量问题域中,信息问题域、技术问题域和流程问题域的问题相对集中和可控,是本规范要求的重点内容。5. 系统架构本章从功能结构和技术结构两个方面简单介绍了数据质量管理子系统的体系结构,在功能结构一节简要描述了各个层次的功能,在技术结构一节描述了各个组件的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国移动 通信 企业 标准
