《EMC存储容灾解决方案要点.pdf》由会员分享,可在线阅读,更多相关《EMC存储容灾解决方案要点.pdf(30页珍藏版)》请在三一文库上搜索。
1、都安人民医院EMC 秒级恢复容灾方案 XX 县人民医院存储项目 EMC 存储恢复容灾方案 2011 年 11 月 都安县人民医院EMC 秒级恢复容灾方案 目录 第1章 EMC 主备存储容灾互切说明. 2 1.1 XX 医院 IT 现状简述.2 1.2 存在的主要问题.2 1.3 EMC的解决方案2 1.4 主备存储、容灾装置等发生故障时切换说明.4 1.5 医疗行业及国内部分容灾案例.5 第2章 生产存储性能和容灾存储可用性说明 9 2.1 生产存储 VNX5100 的性能说明9 2.2 生产存储 VNX5100 的空间分配.11 2.3 生产存储 VNX5100 的性能监控和解决建议.11
2、2.4 容灾存储的可用性说明12 第3章 实施步骤、效果说明和测试方案. 13 3.1 整个 EMC Recoverpoint 实施步骤和时间预估13 3.2 效果说明13 3.3 测试目的14 3.4 测试环境说明14 3.5 服务器系统15 3.5.1常见系统故障 15 3.5.2常见系统维护 15 3.6 测试项目设置16 3.7 具体测试内容17 3.7.1数据一致性测试 19 3.7.2数据容灾故障恢复测试 20 3.7.3容灾 : 任意时间点回滚测试 . 22 3.7.4容灾 : 容灾存储恢复至主存储数据测试. 24 3.7.5容灾 : 主存储误操作数据恢复测试. . 25 第4章
3、 EMC 秒级恢复容灾方案RecoverPoint 介绍 27 4.1 EMC RecoverPoint介绍 27 都安县人民医院EMC 秒级恢复容灾方案 第1章 EMC 主备存储容灾互切说明 1.1 XX医院 IT 现状简述 1? Copyright 2011 EMC Corporation. All rights reserved. 主机房 备用机房 HIS/ PACS*2 8口san-switch*2 LAN 都安县人民医院信息系统现状 NX4 3 台数据库服务器,包括HIS、LIS、PACS 等。存储使用一台EMC NX4 。 1.2 存在的主要问题 1,保存全院关键业务数据的存储只有
4、一台,存在单点故障,一旦出现灾难 事件,全院业务将受到影响。 2,PACS 影像文件没有实现归档,占用主存储空间和降低主存储性能。 3,随着业务的增长,现有的NX4会遇到更大的性能压力。 1.3 EMC 的解决方案 EMC 推荐的解决方案采用业内最成熟、可靠、先进的技术,可以很好的解决 以上三点问题。 EMC 方案非常方便的融合到现有的应用系统中,应用系统无需做 都安县人民医院EMC 秒级恢复容灾方案 大的变动。 整个拓扑如下: 2?C opyright 2011 EMC Corporation. All rights reserved. HIS/PACS 数据库 服务器 HIS等备机 4x
5、4x 4x SAN SAN 1x 1x 4x 生产机房灾备机房 医院内部网络 以太网 FC VNX5100 VNX5100 EMC 容灾装置 recoverpoint 生产副本 日志 生产 日志 CDP实时同步数据 2x 2x 都安县人民医院信息系统基础架构效果图 2x 16口san-switch*2 8口san-switch*2 NX4 2x 链路1km 2x VMware vSphere 方案说明: ( 一)服务器: 原有的两台服务器可不做修改,配置一台服务器或在其上安装 虚拟机给灾备阵列,安装HIS 等软件,作为 HIS等系统的备机。 ( 二)存储交换机: 原有生产机房内的两台光纤存储交
6、换机升级为16 口,新购 置两台 DS-300B 8口光纤交换机置于容灾机房。 ( 三)信息中心生产和容灾存储:原有机房增加一台 EMC 中端存储 VNX5100 阵 列,原来的 NX4在完成数据迁移后作为备份存储使用。 ( 四)业务连续性保护装置:增加 2台连续数据保护 RecoverPoint 服务器装置, 通过旁路实现数据的同步,不对主阵列造成性能上的负担。2 台装置之间采 用高可用配置,任何一台故障,对生产或容灾没有影响。若2 台装置发生故 障,对生产也没有任何影响。 ( 五)业务连续性保护软件: 使用 EMC 独有的技术产品RecoverPoint CDP ,将 生产存储上的关键应用
7、数据(HIS/PACS)实时同步到容灾存储上, 实现数据的 2 份保存。RecoverPoint 具备传统容灾方案所没有的数据回滚功能,可以解 都安县人民医院EMC 秒级恢复容灾方案 决传统容灾经常碰见的致命问题数据库因逻辑故障而无法启动的故障,通过 RecoverPoint 精确到 IO 数据回滚功能完美解决。 同时 RecoverPoint 还有支 持异构存储整合、灾备存储根据需要打开容灾数据库、链路带宽压缩等一系 列高端功能。 1.4 主备存储、容灾装置等发生故障时切换说明 此处假设已经完成生产和容灾阵列以及容灾装置、网络等架构部署, 在生产 机房的 EMC VNX5100 作为主生产阵
8、列(标识为一号存储), 容灾机房的 VNX5100 作为容灾阵列(标识为二号存储) 。针对阵列、 recoverpoint 装置的故障切换步骤 描述。 当生产存储(一号存储)发生误操作时,应急操作如下: 1由于二号存储内的数据随时可用,可以在 10 分钟内回滚到过去任意 时间点的 ;故把容灾机房内的二号存储进行切换操纵,升级成生产存 储,提供存储服务。对于生产主机或容灾主机读写,RecoverPoint 装置会继续纪录这些主机的写I/O 。 2在生产机房的一号存储故障解决后,使用容灾机房的二号存储的正确 数据覆盖一号存储的数据,这一动作在后台完成。VNX5100带宽为 400MB/s ,假设有
9、 30% 带宽用于后台覆盖原生产存储的数据操作,则每 小时大概可以往原生产存储写360G数据。可以快速的实现HIS/LIS 的数据同步。 3等一号存储数据覆盖和数据正确性检验完成后,把一号存储重新升级 成主存储给生产主机访问。 当容灾存储(二号存储)发生误操作时,应急操作如下: 1若容灾存储二号存储发生故障,对生产系统无任何影响。 2等二号存储的故障修复后;通过 EMC Recoverpoint 装置将变化的数 据同步到二号存储上。这一动作在后台完成,实现两边的数据一致可 用。 当 recoverpoint容灾装置发生误操作时,应急操作如下: 1首先 recoverpoint装置是由 2 个单
10、节点组成的高可用集群,真正消 都安县人民医院EMC 秒级恢复容灾方案 除了单点故障。 2假设一台发生故障,对生产阵列、容灾阵列没有任何影响,2 台装置 间的集群会自动接管,继续实现数据的实时同步。 3假设 2 台均发生故障,由于recoverpoint采用的是旁路方式,对生 产阵列也没有影响,暂时无法实现对容灾阵列的数据同步。不过2 台 同时坏的几率极低。 4在 recoverpoint装置修复好后,可以将生产阵列的数据全部重新同 步到容灾阵列上。 5Recoverpoint容灾服务器装置最大支持8 个节点组成高可用集群。 本 次配置 2 个 RecoverPoint 设备群集使用, 2 个均
11、处于活动状态, 带宽 高达 150MB/s ,足以实现关键数据连续保护, 记录写 I/O 需要的带宽。 当存储交换机发生误操作时,应急操作如下: 1共有 4 台存储交换机,组成2 个独立、冗余的 fabric网络。 2新 购 的 2 台 SAN 交 换 机 为 8Gb 的 带 宽 , 完全 可 以 满 足 医 院 HIS/LIS/PACS 的带宽要求。 3任何一台交换机故障均不会影响生产、容灾。 4交换机的故障修复后, 插回原来的位置继续提供冗余的fabric网络。 可见,在处理误操作, 数据回滚方面, 对生产带来的影响仅仅是切换的数分 钟甚至秒级恢复时间,符合医院的数据不丢失,应用中断到最小
12、的要求。 1.5 医疗行业及国内部分容灾案例 说明: EMC Recoverpoint 有 3 种部署模式: CDP: 本地业务连续性保护 (2km), CRR: 远程业务连续性保护 (2km-1000km), CLR: 本地和远程业务连续性保护 序号客户名容灾类型距离源端存储目标端存储容量应用类型 都安县人民医院EMC 秒级恢复容灾方案 1 河南肿瘤医院CDP 本地CX CX 5T HIS、LIS 2 温州医院附二院本地 CDP 本地CX CX 12T 3 柳州市人民医院CDP 本地VNX VNX 6TB HIS、LIS 4 百色右江附属医院CDP 本地VNX VNX 5TB HIS、LIS
13、 5 福建省电力公司CRR 220 公里 福州 -三明CX4 CX4 1TB SQLOracle 6 福州市电力公司CRR 福州不同机房CX700 CX500 1TB SQLOracle 7 北京地稅局CRR 北京不同机房 8 成都市政厅CRR 成都不同机房 9 北京中国国际金融 有限公司CRR 北京 -上海1TB Oracle 10 景顺长城基金CRR 深圳 -北京CX3-80 CX3-20 Oracle 11 中欧基金管理有限 公司CRR 上海 -深圳4TB Oracle 12 博时基金管理公司CRR 北京 -深圳CX4-480 CX3-40 1TB Oracle 13 台北勞保局CRR
14、台北不同机房 14 武汉公积金CRR 武汉不同机房CX3 CX4 AIX DB2 15 广州市交通委员 会 CRR 广州不同机房 40 公里 HP EVA CX4-960 10T Oracle 10g 16 湖南交通本地 CDP 本地DMX4 CX4 4TB Oracle 17 江西电力本地 CDP 本地XP24000 CX4-960 3TB Oracle 18 湖南烟草本地 CDP 本地DMX4 CX380 4TB SQLOracleDB2 19 內蒙北方電力公司本地 CDP 本地CX3 HP EVA 4TB Oracle 20 台北全聯實業股份 有限公司本地 CDP 本地18TB SQL
15、21 宜昌社保本地 CDP 本地CX4 IBM DS4800 4TB SQLOracle 22 台北寶來金融集團本地 CDP 本地13TB SQLExchange 23 香港房屋協會本地 CDP 本地CX3 CX 1TB Oracle 都安县人民医院EMC 秒级恢复容灾方案 24 新韩银行CLR 北京 -南京CX3-80 CX3-40 Oracle RAC 25 韩国外换银行CRR 北京 -南京CX4-960 CX4-480 6TB Oracle RAC 26 襄樊航宇救生CRR 襄樊NS480 NS480 4TB SQLOracle 27 天津移动 CDP + AP7600 天津DS8300
16、 DS8300 OracleDB2 28 湖南财政CRR 长沙 -岳阳DMX4-950 NS480 29 湖南财政CDP 本地DMX4-950 NS120 30 湖北电力CDP 同城DMX4-950 CX4 31 信诚保险CRR 广州 北京CX3-20 CX4-120 Oracle 32 长大公路CRR 广州两机房CX3-20 NS120 SQL 33 山西新闻网CDP 本地CX4 CX4 DB2 34 南方航空CDP 本地CX3-40 CX3-40 35 武汉住房公积金CDP 本地CX4-120 CX4-120 36 湖南中烟CDP 同城NS240 NS240 37 PICC 中国人寿 CD
17、P,CRR 全国 154 套 RecoverPoint,30 多个省市 38 银河基金CLR 上海 -深圳CX CX 39 东莞银行CDP(AP7600) DS8100 with PPRC DS5100 3TB 40 山西移动CRM CDP 本地 IBM DS8300 IBM DS8300 财务统计 41 伟创力技术有限公 司 CRR 同城 2 个工厂NS480 NS480 SQL 42 台湾移动CLR 台北 -高雄CX4 CX4 43 湖南财政局CLR 500KM 长沙 -邵 阳 NS480 DMX 4T Oracle, sQL 44 湖南运输厅CDP 本地DMX CX 4T Oracle
18、45 长兴资产管理局CRR 上海同城CX4-240 CX4-240 DB2 都安县人民医院EMC 秒级恢复容灾方案 46 台湾公共电视服务 中心 CDP 本地CX4 CX4 DB2 47 镇州丹尼斯仓库CDP 本地CX CX 48 江苏移动CRR 同城DMX4 NS480 49 广东省常达公路设 计局 CRR 同城CX3-20 NS120 4TB oracle 50 河北电力CRR 同城NS480 NS480 Oracle 51 广西柳工机械股份 有限公司 本地 CDP、 Cisco9222i 本地DMX4 IBM DS4800 20T SAP、Oracle 52 柳州华锡集团CRR 异地NS
19、480 NS480 5T Oracle、sqlserver 都安县人民医院EMC 秒级恢复容灾方案 第2章 生产存储性能和容灾存储可用性说明 2.1 生产存储 VNX5100 的性能说明 此次配置的生产存储及容灾存储均为EMC 中端阵列 VNX5100 。全球已经售出 1 万台以上。获得了客户的良好评价,尚未遇到性能瓶颈,此外还可以通过EMC 的企业级闪存盘 (SSD)和 FAST软件包大幅度提升阵列的性能。 VNX 系列是一种强健的平台, 整合了原有的数据块存储、 文件服务器和直连 应用程序存储, 使客户可以动态增加、 共享和经济高效地管理多协议文件系统以 及 多 协 议 数 据 块 存 储
20、 访 问 。 VNX 操 作 环 境 支 持Microsoft Windows? 和 Linux/UNIX 客户端在多协议( NFS 和 CIFS)环境中共享文件。同时,它还支持 高带宽和对延迟敏感的数据块应用程序的 iSCSI 、光纤通道和 FCoE 访问。 EMC Atmos ? Virtual Edition软件和 VNX 存储结合使用,可支持基于对象的存储, 并使客户能够通过 EMCUnisphere 管理 Web 应用程序。 VNX 系列的新一代存储平台包括VNX5100, VNX5300, VNX5500, VNX5700 和 VNX7500 ,由带 6-Gb/s SAS 驱动器后
21、端的 Intel Quad Core Xeon 5600系列提 供支持,与上一代的存储相比,性能得到大幅提升: 运行Microsoft SQL 和 Oracle 的速度比以前快3 倍 不到两分钟就可使系统性能翻倍,而且无中断 运行数据仓库的速度快3 倍 都安县人民医院EMC 秒级恢复容灾方案 VNX 系列专门设计为利用闪存驱动器技术的最新创新成果,最大程度提高存 储系统的性能和效率, 同时将每 GB 成本降至最低。 即使只有数个闪存驱动器与 EMC FAST 套件结合使用,客户也可以体验到 FLASH 1st 策略带来的最佳优势。 VNX 的主要特性包括: 无折扣的可用性:即使在出现故障的情况
22、下也可以保证相同的性能和服务 级别。 免费的高级功能: 通过数据压缩、 文件系统数据消重、 虚拟资源分配的技 术,以实现对存储更有效的使用。 丰富的软件: VNX 软件包提供所有必要的功能来管理和保护客户的信息, 包括数据复制功能、 通过快照和克隆实现按时间点数据恢复功能,以及定 义保护策略等。 自动分层: EMC 独特的 FLASH 1 st 策略可以将“热”数据自动放到高性能 磁盘和缓存中,已最小的管理代价提高应用的性能。 集中管理: EMC Unisphere 管理软件通过简单易用、集成化的管理方式, 减少对用户的配置、管理和监控工作量。 灵活的模块化设计: 用户可以初始配置文件或块存储
23、的功能,需要的时候 升级为同一存储。 虚拟化集成 . EMC10 与 VMware10 vSphere? 有超过 60 个集成点,这 使 VNX ? 最大限度地提高了性能和易用性。EMC 是唯一一家支持所有 vStorage API 系列产品的供应商。 都安县人民医院EMC 秒级恢复容灾方案 高效的架构:多核Intel Xeon处理器和 6 Gb/sec SAS 提供了更好的性能和高 级软件的基础。 EMC阵列 在医 疗 行 业 拥 有强 大的稳 定性 和性 能 。 比 如 玉 林 人民 医院 (CX4-480,HIS/PACS/LIS) 和柳州人民医院VNX5500均未遇到性能问题。且 VN
24、X5100 的 16G内存和后端 24Gb的带宽,最大可以支持150TB容量,完全可以 满足医院的性能和以后的空间需求。 故我们认为, VNX5100 作为生产阵列完全可以满足客户的性能需求。 2.2 生产存储 VNX5100 的空间分配 目前配置 600G*8 SAS2.0 15krpm 硬盘和 2TB*4 块 NL-SAS 7.2krpm 硬盘, 可用空间达 12TB 。 主要有 2 个应用: HIS、PACS 。 对于 HIS 系统分别分配 2TB, 使用虚拟资源调配功能分配空间给2TB给 PACS( 每个月 800G)分配,最高可 扩展至 10 个 TB 。 预计 HIS 日志空间,每
25、天变化100M ,按照数据往前回滚30 天的要求计算所 需的空间为: 100MB*30/0.75=4000MB. 空间上可以满足客户的需求。 2.3 生产存储 VNX5100 的性能监控和解决建议 实施完 recoverpoint后,EMC 将会在 1-2 个月内收集 VNX5100 的性能数据, 通过 EMC 专业的工具进行分析,检查系统中是否存在阵列的瓶颈。 若存在性能问题,可以通过2 种方式提升性能: 1,添加闪存盘和 FAST suite 包,提升存储的二级cache; 2, 通过 FAST suite自动的将热点数据迁移到闪存盘, 提升整个阵列的性能。 都安县人民医院EMC 秒级恢复
26、容灾方案 2.4 容灾存储的可用性说明 容灾存储的数据通过Recoverpoint从生产存储迁移到VNX5100 上。结合容 灾存储上配置的服务器,在需要的时刻将VNX5100 二号机上的 HIS 数据库打开, 模拟生产环境。 在模拟的环境中可以用作: 1,解决数据库的逻辑故障, 快速的将二号存储上的数据恢复到一号存储上, 从而保证数据库能够打开; 2,减少数据的丢失,在生产系统遭遇病毒、人为误删除后,二号存储可以 快速任意 IO 回滚,找到丢失的数据,从而减少医疗纠纷。 3,降低新业务上线前的风险,模拟的环境进行BUG 测试; 4,降低数据库的升级风险,数据库升级前的模拟环境,在遇到故障后可
27、以 进行任意的回退; 5,制作月报、年度报表,历史数据查询,减轻生产阵列的压力。 6,通过不断的演练 recoverpoint,可以让客户熟练掌握EMC 的容灾技术, 在关键时候能够快速的实现数据的恢复、减少应用停机的时间。 都安县人民医院EMC 秒级恢复容灾方案 第3章 实施步骤、效果说明和测试方案 3.1 整个 EMC Recoverpoint 实施步骤和时间预估 编 号 实施内容实 施 所 需 的 时 间 备注 1 安装 VNX5100 阵列和 recoverpoint 容灾装置和软件、 SAN-Switch交换机, 部署两边机房网络。 3 天 2 两个机房安装HIS、PACS 服务器,
28、接入到SAN网络,用于连接VNX5100 1 天集成商安装服务器 3 通过 recoverpoint 将 NX4上的 HIS、PACS 数据全部同步到VNX5100上。1 天 4 两台 VNX5100进行 recoverpoint 同步,使两者信息一致。数分钟 5 容灾演练1 天 3.2 效果说明 1, 实现存储间的数据互联互通、相互流动的功能。 2, 实现主备存储间数据实时同步,主备存储的数据一致、高可用的功能。 3, 实现当主存储发生逻辑错误后, 可以通过备用存储对主存储的数据追回、不丢 失数据的功能。 4, 实现存储上的数据任意时间点回滚功能,有效地避免主数据库的逻辑错误或突 然断电导致
29、数据库无法正常运行的故障。并将数据丢失率降低至最小。 5, 实现备用存储的在线使用功能, 当备用存储的数据修改后, 能够直接恢复到主 存储。该功能可以在备用存储上打开数据库,实现报表、测试、升级、培训 等操作,分流用户的业务,降低生产系统的负载。 6, 完成备用存储的报表、测试、升级、培训功能后,可以通过主存储将其变化的 数据继续同步到备用存储,恢复存储间的数据实时同步,保持数据一致、高 都安县人民医院EMC 秒级恢复容灾方案 可用状态。 3.3 测试目的 为了检验是否可以达到客户的要求,在首次完成recoverpoint后,需要按 照以下的要求进行测试: 1,实现河池 XX 医院 HIS 等
30、应用系统容灾,实现存储设备数据同城或者异 地容灾功能 3,对出现故障以后 (服务器 , 存储, 应用软件 )进行数据恢复演练,测试数据 及应用恢复时间。 3.4 测试环境说明 测试环境组网架构图如下: 为 实 现上 述的 测试 目标 , 需 要 在 河 池 XX 医 院测 试环 境 中 搭 建 一 套 EMC RecoverPoint 应用装置 (RPA) 本地复制卷 本地日志卷 VNX5100 本地生产卷 服务器 HIS/PACS 光纤交换机 VNX5100 都安县人民医院EMC 秒级恢复容灾方案 RecoverPoint系统,主要组成部件有 : VNX5100系列存储两台 . 光纤线及光纤
31、交换机2 台 服务器,安装 WIN2008 系统和数据库 EMC Recoverpoint RPA 两台 控制电脑两台 3.5 服务器系统 3.5.1 常见系统故障 本测试根据实际工作环境下系统可能发生的故障或事故,EMC 总结了应用运行 时常见故障,并提供数据安全解决之道。 常见多发故障: 服务器故障 SAN网络故障 生产存储硬盘损坏 生产存储控制器损坏 数据库逻辑错误导致数据库无法启动 工作人员误操作导致数据丢失 黑客攻击人为恶意篡改数据 3.5.2 常见系统维护 本测试根据实际工作环境下系统可能发生的业务和工作情况,EMC总结了常 见维护事项,并提供例行维护解决之道。 生产服务器补丁升级
32、 数据库补丁升级 都安县人民医院EMC 秒级恢复容灾方案 业务系统统计报表 应用软件开发测试 工作人员培训 系统容量不足增加硬盘 设备性能不足设备替换 3.6 测试项目设置 根据上述故障和例行维护特点,同时结合EMC以往客户在安装、实施、运维 时的经验设计了以下测试场景: 维护项目解决方法测试项 异构存储整合 EMC RecoverPoint 现场不演示 生产服务器 /小型机故障 异地容灾现场演示容灾切换 SAN网络故障 双链路负载均衡本次不测试 生产存储硬盘损坏 Raid保护存储基本功能,本次不测试 生产存储控制器损坏 主备控制器倒换存储基本功能,本次不测试 数据库逻辑错误导致数 据库无法启
33、动 异地容灾现场演示容灾切换 工作人员误操作导致数 据丢失 任意时间点回滚现场演示任意时间点回滚 黑客攻击人为恶意篡改 数据 任意时间点回滚现场演示任意时间点回滚 生产服务器 / 小型机补丁 升级 容灾存储使用现场演示容灾存储使用 数据库补丁升级 容灾存储使用现场演示容灾存储使用 都安县人民医院EMC 秒级恢复容灾方案 业务系统统计报表 容灾存储使用现场演示容灾存储使用 工作人员培训容灾存储使用现场演示容灾存储使用 设备性能不足设备替换 数据迁移现场演示数据迁移 3.7 具体测试内容 数据一致性测试: -添加 CDP保护卷: 模拟生产系统在正常运行时,将指定的应用数据纳入RecoverPoin
34、t 系统 保护的过程,以此验证RecoverPoint系统实施的方便和灵活程度。 -删除 CDP保护卷 : 模拟生产系统在正常运行时,将指定的应用数据脱离RecoverPoint 系统 保护的过程,以此验证RecoverPoint系统更改的方便和灵活程度。 -CDP数据复制 : 模拟生产系统在正常运行时,受保护的生产数据向CDP备份卷复制的过 程。 -CDP粒度设置: 模拟生产系统在正常运行时,在RecoverPoint系统中设置恢复时间点, 调整恢复点的粒度,从系统优化的推荐值到最小1 秒钟或者是精确到每 个 I/O -CDP一致性组: 模拟生产系统在正常运行时,将指定的应用程序及数据库数据
35、加入到一 致性组,以此验证RecoverPoint系统在多个数据源之间的一致性。 容灾故障切换测试: -故障切换: 模拟生产系统在正常运行时,主存储阵列故障导致应用数据不可用时, RecoverPoint系统如何在备份端启动应用并保证数据一致可用。 都安县人民医院EMC 秒级恢复容灾方案 -故障回切: 模拟生产系统切换到备份端运行时,主存储阵列恢复正常后,备份端对 应用数据所做的修改可以被保存,并且在应用切换回主存储阵列时上述 修改不会丢失,验证整个切换过程的方便和灵活程度。 容灾数据回滚测试: -CDP回滚: 模拟生产系统在正常运行时,由于操作失误造成数据丢失,使用 RecoverPoint
36、系统恢复到最近一个正常的时间点, 在最短时间内恢复应用 同时使得数据丢失量最小。 -CDP模拟回滚与物理回滚流程: -模拟生产系统在正常运行时,由于操作失误造成数据丢失,使用 RecoverPoint系统模拟回滚到最近一个时间点, 经检查后此时间点数据仍 是丢失状态,继续回滚到上一个时间点,检查数据是否仍然丢失,直至 找到最近一个正常的时间点,验证模拟回滚和物理回滚之间操作的便利 性。 容灾存储使用 在主生产存储在使用时,在容备存储打开数据库,进行报表,开发,培训, 校验等,同时不影响容灾业务。 都安县人民医院EMC 秒级恢复容灾方案 3.7.1 数据一致性测试 测试内容基本功能测试厂商人员
37、测试时间2011 年月日局方人员 测试目的 1、 完成对生产数据的复制,生成本地备份数据 2、生成基于时间点的复制信息 3、检查 RecoverPoint CDP时间点的粒度 环境描述 方案 /步骤 方案描述: 1、 选定生产环境中的LUN 2、 指定本地备份存放LUN 3、 启动 CDP保护 4、 检查 CDP时间点的粒度 5、 在生产服务器上对数据库进行数据更新 测试预期结 果说明 -Recoverpoint CDP是基于 IO 拆分的带外复制技术,其实施对生产主机完全 透明 -依赖 LVM 的 CDP方案,对生产主机不可避免影响性能,尤其是目标端存储 性能配置较差时 -依赖 LVM 的
38、CDP方案,不能做到RPO为零,因为其时间点颗粒数量有256 这个限制 -依赖 LVM 的 CDP方案,并不能确保RTO为零,因为主机LVM 的技术限制 造成生产端存储在灾难发生时,生产卷和复制卷的数据不一定能够保持完 全一致 -Recoverpoint CDP不依赖于主机的LVM,不增加主机CPU的开销 -正由于 Recoverpoint CDP不依赖于主机的LVM,所以这个方案独立于任何 主机操作系统。 无论是 Windows 或者是 UNIX, 都可以用同一个Recoverpoint CDP方案实现 -Recoverpoint CDP的启动,不对生产主机的VG作任何变更,不需要停机修 都
39、安县人民医院EMC 秒级恢复容灾方案 改 VG 配置等操作 -Recoverpoint CDP实施的拆除,也不需要对生产主机的VG 作任何变更 -Recoverpoint CDP时间点的粒度可以是系统优化、1 秒、或者 1 个写 IO。数 量上没有256 的限制。真正做到RPO为 0 -Recoverpoint CDP的数据一致性,是靠一致性组(CG: Consistency Group) 和 CG set来实现的 -依赖 LVM 的 CDP方案,没有 CG Set这个概念来确保联合型应用的数据一致 性保护 -Recoverpoint CDP最多可由 8 个节点构成高可用的集群,大大多于一般的
40、两 节点 CDP方案,确保了核心数据复制的性能和可用性 实际测试结 果说明 测试效果 测试人:测试时间: 3.7.2 数据容灾故障恢复测试 测试内容故障恢复测试厂商人员 测试时间 2011 年月日局方人员人 员 测试目的验证在主存储故障情况下使用备用存储恢复应用 方案 / 步骤 方案描述: 1、 在生产正常运行时将主存储与生产服务器断开(断开主机连接交换机的光纤) 2、 在 Recoverpoint 管理界面进行Access last image 3、 在备用服务器上认盘,将本地CDP复制卷 mount 起来 4、 在备用服务器上重启应用,查看应用是否能正常运行 5、 查看数据有否丢失 都安县
41、人民医院EMC 秒级恢复容灾方案 6、 在备用服务器上关闭应用,umount CDP 复制卷 7、 在生产服务器上重启应用 8、 在 Recoverpoint 管理界面进行disable image access 9、 确认 CDP保护被恢复 测试预期 结果说明 在主存储故障情况下,服务器能够使用备用存储恢复应用 RecoverPoint CDP带外复制技术能真正做到RPO=0 ,RTO基本控制在1 分钟内 实际测试 结果说明 是否符合预期效果是 否 备注 都安县人民医院EMC 秒级恢复容灾方案 3.7.3 容灾: 任意时间点回滚测试 项目名称 任意时间点回滚功能测试厂商人员 测试时间 201
42、1 年月日局方人员 测试目的 在应用发生逻辑错误时,使用RecoverPoint CDP将应用回退到指定时间点 方案/步骤 方案描述: 在应用数据库中删除某张表,使用RecoverPoint CDP将应用回退到删除动作 之前的某时间点,恢复正常数据. 详细步骤: 1、 在生产服务器上,删除oracle 数据库中某表 2、 在 Recoverpoint 界面中 bookmark 当前时间, 作为时间参照, 以方便寻早需要 回退的时间点 3、 在 Recoverpoint 管理界面进行Access image 4、 在 RecoverPoint 日志中查找删除动作前最近的时间点 5、 在备用服务器
43、上认盘,将本地CDP复制卷 mount 起来 6、 在备用服务器上验证应用是否正常,删除的数据表是否被恢复 7、 如删除的数据表不能恢复正常,则在备用服务器上关闭应用,umount CDP 复 制卷,在RecoverPoint 日志中再次选择之前最近的时间点,重复5-7 步,直 至确认所选的时间点对应的数据表被恢复 8、 在确认数据表被恢复正常后,在备用服务器上关闭应用,umount CDP 复制卷, 重新在 Recoverpoint 管理界面进行Access image 这个时间点,以执行真实物 理回滚操作 9、 再次在备用服务器上认盘,将本地CDP复制卷 mount 起来并启动应用 10、
44、 再次确认数据表被恢复正常 测试预期 结果说明 RecoverPoint CDP的 virtual access功能,便于快速确定可能的时间恢复点;在 执行 virtual access 的同时,不影响数据从生产存储到备用存储的复制保护 RecoverPoint CDP的 physical access 功能,用于在确定时间恢复点后,把target 卷真正回退到该时间点,以便备用服务器进行IO 读写 都安县人民医院EMC 秒级恢复容灾方案 实际测试结 果说明 测试效果 测试人:测试时间: 都安县人民医院EMC 秒级恢复容灾方案 3.7.4 容灾: 容灾存储恢复至主存储数据测试 项目名称 CDP
45、 Failback功能测试厂商人员 测试时间 2011 年月日局方人员人 员 测试目的确认服务器对备用存储上的数据的更改,能够通过Failback 被恢复至生产存储 方案/步骤 方案描述: 在上述测试后,在备用服务器上进行数据变更,并通过CDP failover 将变更 后的数据恢复至生产存储。 详细步骤: 1、 继续前述测试,在备用服务器上,创建oracle 数据库中某表 2、 关闭备用服务器上的应用,umount CDP 复制卷 3、 关闭生产服务器上的应用,umount CDP 生产卷 4、 在 Recoverpoint 管理界面进行Failover 5、 在 Recoverpoint
46、管理界面进行Failback 6、 在生产服务器上认盘,将本地CDP生产卷 mount 起来 7、 在生产服务器上验证应用是否正常,前面创建的数据表是否正常 测试预期 结果说明 Recoverpoint CDP不依赖主机LVM,其Failback 的过程非常简单,不需要在生产 主机上对VG内的每个LV进行任何操作; 而且在备用存储的数据更新到生产存储 的过程中,备用服务器的性能不受影响 依赖主机LVM 的 CDP方案,在备用存储的数据更新到生产存储的过程中,不可 避免影响备用服务器的IO 性能 实际测试结 果说明 是否符合预期效果是 否 备注 都安县人民医院EMC 秒级恢复容灾方案 3.7.5
47、 容灾: 主存储误操作数据恢复测试 项目名称指定时间点回滚功能测试厂商人员 测试时间 2011 年月日局方人员人 员 测试目的 确认服务器对生产存储上的数据的误操作,能够通过备用存储将被误操作的数据 恢复至生产存储,而不覆盖主存储新生产的数据 方案/步骤 方案描述: 在主存储端的应用数据库中删除某张表或者文件,使用RecoverPoint CDP 将 应用回退到删除动作之前的某时间点,恢复正常数据. 详细步骤: 11、在生产服务器上,删除oracle 数据库中某表 12、在 Recoverpoint 界面中 bookmark 当前时间,作为时间参照,以方便寻 早需要回退的时间点 13、在 Re
48、coverpoint 管理界面进行Access image 14、在 RecoverPoint 日志中查找删除动作前最近的时间点 15、在备用服务器上认盘,将本地CDP复制卷 mount 起来 16、在备用服务器上验证应用是否正常,删除的数据表是否被恢复 17、如删除的数据表不能恢复正常,则在备用服务器上关闭应用,umount CDP 复制卷,在RecoverPoint 日志中再次选择之前最近的时间点,重复5-7 步,直至确认所选的时间点对应的数据表被恢复 18、在确认数据表被恢复正常后,在备用服务器上关闭应用,umount CDP 复制卷,重新在Recoverpoint 管理界面进行Acce
49、ss image 这个时间点,以执 行真实物理回滚操作 19、再次在备用服务器上认盘,将本地CDP复制卷 mount 起来并启动应用 再次确认数据表被恢复正常 20、将该误删除的数据恢复至主存储上,而不改变主存储上新产生的数据 测试预期 结果说明 RecoverPoint CDP的 virtual access功能,便于快速确定可能的时间恢复点;在执 行 virtual access 的同时,不影响数据从生产存储到备用存储的复制保护 RecoverPoint CDP的 physical access 功能,用于在确定时间恢复点后,把target 都安县人民医院EMC 秒级恢复容灾方案 卷真正回退到该时间点,以便备用服务器进行IO 读写 实际测试结 果说明 是否符合预期效果是 否 备注 都安县人民医院EMC 秒级恢复容灾方案 第4章 EMC 秒级恢复容灾方案RecoverPoint 介绍 4.1 EMC RecoverPoint 介绍 RecoverPoint的原理图 EMC Recoverpoint 产品具有如下的基本特点: 提供实时的数据复制保障, 确保在各种故障发生的情况下数据的完整性。 便于实现应用的远程容灾。 基于标准 IP 网络进行数据复制, 同时采用智能化带宽缩减技术来实现对 带宽需求的空前降低。 都
链接地址:https://www.31doc.com/p-5196814.html