XX区公共数据运营服务项目-ODPS迁移服务采购需求.docx
《XX区公共数据运营服务项目-ODPS迁移服务采购需求.docx》由会员分享,可在线阅读,更多相关《XX区公共数据运营服务项目-ODPS迁移服务采购需求.docx(7页珍藏版)》请在三一文库上搜索。
1、XX区公共数据运营服务项目-ODPS迁移服务采购需求一、项目背景目前XX区公共数据平台数据底座采用EMR大数据架构,但由于EMR在兼容性、漏洞修复等方面存在一定不足,技术力量难以保障,造成资源利用率和运行效益较低,运维难度较大。参考省市和周边区县,均采用ODPS大数据架构,该架构运行稳定。因此XX区亟待切换为ODPS作为计算存储资源。二、项目目标提将底层平台从EMR平稳迁移至ODPS,有效提升平台数据处理能力和效率,降低运维成本,并提升公共数据系统的安全性、稳定性和可靠性。三、项目概况公共数据平台作为全区基础数据底座重点应用项目,共享子应用系统数量多,日常运营稳定性要求高,目前支撑全区52个部
2、门,92个应用。为进一步提升数据存储的架构统一性和公共数据平台安全可靠性,需要通过开展ODPS迁移服务,将XX区已有的EMR大数据架构迁移到ODPS,实现和省市统一,提升数据扩容运维效率,提升公共数据平台的安全可控能力。整个ODPS迁移工作包含历史归集迁移、历史回流迁移、历史开放迁移、共享迁移、数据仓迁移和专题库存量模型迁移。四、服务内容整体迁移工作包括以下6个模块,在迁移过程中,数据仓中表及任务数量实时发生变化,下述各模块的迁移数量将以实际情况为准。(一)历史归集迁移历史归集数据和任务迁移主要包含:(1)历史归集任务迁移改造方案制定通过梳理历史已归集的数据和任务,基于新的归集链路要求,制定归
3、集数据任务的迁移方案,实现先归集到部门仓,再到区总仓的链路。(2)历史归集任务部门仓链路改造针对历史区总仓基于Hive归集的任务,支撑部门开展基于部门仓ODPS开展归集迁移工作。通过梳理历史已归集基于HiVe归集任务数据和任务,梳理待迁移的归集任务情况,并基于实际待迁移的区总仓归集数据任务内容,开展建表和任务迁移工作,开展任务验证。(3)历史归集任务部门仓到区总仓链路创建首先梳理历史已归集的ODPS部门仓数据和任务,梳理待历史归集迁移的表和历史任务情况,并基于实际待迁移的历史归集部门仓的数据任务内容,开展区总仓的建表和任务迁移工作,并对迁移数据任务的验证。历史归集不限于现有2000多张表和21
4、00多个任务。完成所有迁移工作,以实际业务数据为准。(二)历史回流任务迁移历史ODPS回流数据和任务迁移工作主要包含:(1)回流任务重建:基于省市回流任务的数据要求,梳理回流任务表的问流规范要求,开展历史回流任务按省/市平台表命名规范重新建表,并进行任务创建和验证。(2)下架目录清理:根据最新的省市回流要求,对历史已回流的数据和任务,梳理待下架回流的目录清单,并根据需要下架的回流目录,开展历史回流数据任务的链路任务和任务配置维护。(3)回流链路改造:根据最新的省市回流要求,对历史已回流的数据和任务,梳理历史回流链路改造思路,对历史已回流数据任务进行链路改造,按要求改造成以数据推送方式到XX市R
5、DS前置库。(4)历史回流任务迁移:针对历史回流任务,将其从总仓迁移至部门仓。通过梳理历史已回流的数据和任务,并制定回流数据任务的迁移方案,根据历史已回流数据迁移的表和任务情况,基于实际待迁移的回流数据任务内容,开展建表和任务迁移工作,并对迁移数据任务的验证。历史回流迁移涉及260张以上表、260个以上任务,完成所有迁移工作,以实际业务数据为准。(三)历史开放任务迁移历史开放数据任务迁移工作主要包含:(1)根据最新的省市数据开放要求,开展历史开放的数据任务迁移工作,迁移服务期间确保开放任务的稳定性,确保历史开放数据链路的正常运行,可及时更新推送数据到市平台。(2)针对历史开放任务迁移至ODPS
6、通过梳理历史开放任务,制定历史开放数据任务的迁移方案,根据历史已开放数据迁移的表和任务情况,基于实际待迁移的开放数据任务逻辑,开展任务迁移工作,并进行开放数据任务的迁移验证。(3)基于上级省市数据开放的数据安全要求,迁移服务期间确保历史开放的数据质量、数据敏感性符合要求。(四)共享迁移共享数据任务迁移主要包含:(1)共享导出迁移:针对历史共享数据任务ODPS迁移要求,通过对历史共享任务的梳理,按照批量数据导出数据频率、数据涉敏程度分优先级,制定共享任务的迁移思路,对接支撑各部门进行历史Hive应用仓数据源批量数据导出任务迁移,并对迁移任务开展任务验证,实现从ODPS应用仓数据源导出。(2)批
7、量共享迁移:基于省市回流标准规范要求,对回流表批量数据共享任务进行迁移,按市最新回流的表命名规范,在ODPS进行共享视图重新创建,并对视图任务进行验证。(五)数据仓迁移数据仓解决了数据使用的最后一公里问题,数据仓迁移主要包含了历史HiVe应用仓/专题库迁移,通过梳理并对接部门,协同部门仓逐步完成数据仓的ODPS项目空间迁移工作。主要服务包含:(1)项目资源开通:支撑应用部门开展ODPS应用仓的申请、创建和扩容等工作,并对应用仓的申请、创建流程进行审核审批。(2)实施数据仓任务迁移:对老的HiVe应用仓的数据和任务进行梳理,了解数据任务的处理逻辑,制定应用层的ODPS迁移思路。基于实际应用仓数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 公共 数据 运营 服务项目 ODPS 迁移 服务 采购 需求
