《数据中心运维管理一----刘林.ppt》由会员分享,可在线阅读,更多相关《数据中心运维管理一----刘林.ppt(67页珍藏版)》请在三一文库上搜索。
1、1,刘琳,2012-5-15,数据中心运维管理培训概述,2,目录,数据中心基础设施主要架构,如何看数据中心的运维,数据中心运维目标、对象、要求,数据中心运维相关标准,数据中心机房运维管理流程、各种规章制度、规范,数据中心运维所面临的一些关键问题,数据中心基础设施架构,柴油发电机,动力配电,不间断电源,电气工程,设备环境控制系统,弱电工程,建筑,机房装修工程,专用空调系统,辅助空调系统,通风系统系统,空调系统,监控中心控制系统,漏水报警系统,综合 布线系统,照明配电系统,电源防雷接地,机房接地,自动报警系统,门禁,CCTV,安防工程,分区气体灭火系统,分区水喷淋系统,配电设施,主要组成 : 配电
2、设备 受电柜 馈电柜 PDU(Power Distribution Unit) 作用: 正常:接受/分配电能 故障 :迅速切断故障 ,维持系统正常运行.,柴油发电机,柴油发电机: 发电机是将其他形式的能源转换成电能的机械设备,它由柴油机做为动力机械驱动, 将燃料燃烧产生的能量转化为 机械传给发电机,再由发电机转换为电能。,ATS开关,ATS组成,ATS一般由两部分组成:开关本体+控制器。而开关本体又有PC级(整体式)与CB级(断路器)之分。,PC级,能够接通、承载、但不用于分断短路电流的ATS,CB级,配备过电流脱扣器的ATS,它的主触头能够接通并用于分断短路电流。 如果过电流故障引起开关断开
3、,ATSE将不会转换。,PC级与CB比较,CB级是由断路器组成,而断路器是以分断电弧为己任,要求机构快速脱扣一般采用四连杆机构。四连杆机构易存在滑扣、再扣不可靠因素:而PC级机构不存在该方面问题。因而PC级产品的可靠性远高于CB级产品。 CB级ATS的电动操作机构一般是通过微电机带动减速齿轮机构对断路器进行合分工作,又因断路器机构的限制,微电机必须工作到堵转后,靠行程开关才断开控制回路。众所周知,微电机堵转工作后,其寿命会大大降低。因而,CB级ATSE电动操作机构可靠性较低。 而PC级ATS的电动操作机构一般为短时工作电磁铁由于电磁铁结构简单,工作可靠好,所以PC级ATSE电动操作机构的可靠性
4、较高。,什么是UPS UPS(Uninterruptible Power System):交流不间断电源,是一种利用电池化学能作为后备能量在市电断电或发生异常等电网故障时不间断地为用户设备提供交流电能的一种能量转换装置。它广泛的应用在银行、医疗、邮电、国防、工业控制、机要机关等部门。,UPS,UPS,不停电供电 全面改善供电质量,精密空调,空调-就是空气调节的简称。,精密空调,空气有四大指标: 温度,湿度,速度和洁净度。,空调作用,就是调节温度,湿度,速度和洁净度。四个指标,人为地创造一个舒适的生活和工作环境 。,精密空调,空调送风方式,图例 1) 风机 2) 电气控制系统 3) 盘管 4)
5、过滤网 5) 压缩机,1,2,4,3,5,2,1,3,4,5,Example for DX-A models,下送风,上送风,精密空调,机房分级的标准,配电系统的整体架构,配电设施,机房配电系统框图,供电设备:精密空调、新风机、市电照明等市电设备,2,目录,数据中心基础设施主要架构,如何看数据中心的运维,数据中心运维目标、对象、要求,数据中心运维相关标准,数据中心机房运维管理流程、各种规章制度、规范,数据中心运维所面临的一些关键问题,案例分享,2,从数据中心的生命周期管理看运维,规划数据中心蓝图,评估当前 状态,制定未来的蓝图.,规划设计,迈进绿色环保型数据中心,通体系过设计,提供数据中心 工
6、程与体系结构的详细设计及 预算,建造,借鉴国际先进管理最佳实践及 自动化管理工具,建立数据中 心管理体系,运营,基于业务需求变化,对数据中 心软硬设施做心要的改造,以 适应发展的需要,改造,IT在企业中位置,应用架构,技术架构,系统 服务 能力 实施,硬件 网络 基础设施 应用,业务架构,业务 流程 工作流 交易 实施,战略 目标 需求 目的 测量,程序 项目 性能 智能,IT架构是为企业 架构提供技术支撑和保障,是企业 提高管理水平、工作效率、降低成本的实现方式 不同时期不同发展阶段,IT部门定位和作用不同 如果IT部门能在企业 业务信息化过程中发挥关键作用,IT部门价值会得到 更广泛的提升
7、,2,数据中心运维的一些特点,数据中心运维的管理是从数据中心规划建设阶段开始。 基础设施建设的质量影响了数据中心运维的好坏。 不同行业的数据中心面临的问题不同 不同的发展阶段的数据中心面临的问题不同 不同的人对问题的看法不同,2,目录,数据中心基础设施主要架构,如何看数据中心的运维,数据中心运维目标、对象、要求,数据中心运维相关标准,数据中心机房运维管理流程、各种规章制度、规范,数据中心运维所面临的一些关键问题,案例分享,2,数据中心运维面临的一些关键问题,体系 技术能力 基础设施,2,目录,数据中心基础设施主要架构,如何看数据中心的运维,数据中心运维目标、对象、职责,数据中心运维相关标准,数
8、据中心机房运维管理流程、各种规章制度、规范,数据中心运维所面临的一些关键问题,2,什么是数据中心基础设施管理,从数据中心角度来看,数据中心运维管理就是:为提供符合要求的基础设施系统服务,而对与该基础设施服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是基础设施服务有关各项管理工作的总称。数据中心运维是数据中心生命周期中历时最长的一个阶段。所谓生产运维期指的是从数据中心项目交付使用,直到项目废除的全过程,也就是项目进行生产运维活动,收回投资,以实现预期投资目标的周期。在此阶段的运维管理,将依托于数据中心已交付的基础设施,通过科学的管理,最终使数据中心得以实现服务与经济上的目标。简
9、单地说,运维管理就是用好、管好已建设交付的数据中心。,2,数据中心基础设施目标,合规性 可用性 安全性 服务性 经济性,2,数据中心基础设施运维的基本策略,及时 规范 安全 可用,2,数据中心基础设施基本策略,及时 采取适应的手段满足服务承诺(SLA)指标的实现。,2,数据中心基础设施基本策略,规范 通过建立适当的服务管理流程、服务活动指导文件或实施原则,以保证服务过程的规范运行。 建立有效的服务管理流程。 建立有效的交付管理流程。 建立数据中心相关管理制度。 对于非例行性操作服务(响应支持、优化改善、咨询评估),应在实施前,制定详细的实施方案 过程有效管理,2,数据中心基础设施基本策略,安全
10、 应采取各种安全手段和措施,有效地控制数据中心运维的各个环节,保护数据中心运维服务中的物理安全、设备设施安全和数据安全。 建立适当的信息安全管理机制,以规范数据中心运维服务人员的信息安全行为,信息安全管理可参照 GB/T 22080 GB/T 22081 ISO27001. 应对数据中心运维服务人员进行相关安全管理及安全要求培训,并进行适当的检查,以确保服务人员了解并遵守数据中心、保密相关规定。 应充分关注数据中心业务安全需求,结合信息安全技术与管理标准,进行适当的安全评估,提供相应的安全建议,并对服务对象进行适当的监控和保护。 应对安全设施、网络系统进行监控、分析、报告,把安全风险控制在可接
11、受的范围内,防止安全事件的发生。 应建立有效的安全通报机制,以及时通报安全事件相关情况和相应防范处理措施等。,2,数据中心基础设施基本策略,可用 冗余和备份的启用规范,建立相关的作业流程和响应机制。 进行合理的人员岗位设置,重点岗位保证专人专岗并设置人员备份。 应配备具有相应能力的人员和必要的工具,并定期进行培训 应选择适用的运维技术,以保证服务的可用性 足够的资源,避免由于资源缺失导致对服务的可用性带来的影响,2,数据中心基础设施运维对象,供电设施 UPS 配电设备 高压变压器 发电机 PDU 环境设施 精密空调 漏水检测 新风机 安防与消防 门禁控制 温感、烟感探测设备 监控录像 气体灭火
12、设施 综合布线 IT微环境 环境监控,2,数据中心基础设施运维组织结构,2,数据中心基础设施运维组织结构,管理层,总经理,执行层,基础设施维护,基础设施建设,网络,。,执行层,供配电,空调,。,主管,主管,工程师,工程师,数据中心基础设施运维组织结构,34,数据中心运维的主要内容,环境监控,场地,UPS,柴机,空调,安防,例行操作,响应支持,优化改善,咨询评估,IT基础设施,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,服务对象,活动,35,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应
13、急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,36,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,37,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,38,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,39,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应
14、急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,40,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,41,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,42,数据中心的运维主要内容,例行操作 监控 预防性检查 常规作业 响应支持 故障及应急处理 优化改善 适应性改进 增强性改进 预防性改进 咨询评估,43,数据中心的发展三个阶段,规范化,标准化,工具化,44,数据中心运维管理体系的流程
15、体系,环境监控,场地,UPS,柴机,空调,安防,通用管理制度,流程,规范,操作指导书,IT基础设施,检查表单,45,数据中心的运维管理的通用管理制度,通用性管理制度 流程 规范 操作指导书 检查表单,46,数据中心运维管理流程体系几种形式,通用性管理制度 流程 规范 操作指导书 检查表单,数据中心运维管理流程体系几种形式,数据中心运维管理流程体系几种形式,应急架构,组织结构,职责,电力,组织结构,职责,环境空调,组织结构,职责,防火,应急流程,应急流程,电力,应急流程,环境空调,应急流程,防火,应急演练,演练计划,电力,环境空调,防火,演练实施,演练评估,演练计划,演练实施,演练评估,演练计划
16、,演练实施,演练评估,应急管理主要内容,数据中心运维管理流程体系几种形式,50,数据中心运维的流程体系,基础设施管理 事件管理流程 问题管理流程 变更管理流程 发布管理流程 配置管理流程 报告,51,数据中心运维的流程体系,52,数据中心运维的流程体系,53,数据中心运维的流程体系,我们所运营的数据中心有几类,事件分级说明: 非常严重事件,造成或可能导致D.C. 服务中断8小时以上,影响全部机房。 严重事件,造成或可能导致D.C. 服务中断4小时以上,或者影响到核心区域。 一般事件,造成或可能导致D.C非核心区域服务中断。 日常事件,其它没有造成机房明显服务中断的事件。,2,目录,数据中心基础
17、设施主要架构,如何看数据中心的运维,数据中心运维目标、对象、要求,数据中心运维相关标准,数据中心机房运维管理流程、各种规章制度、规范,数据中心运维所面临的一些关键问题,数据中心运维的标准,ISO20000 ISO270001 ITIL,ITSM, Information Technology Service Management,意为信息,技术服务管理, IT服务管理(ITSM)是一种以流程为导向、以客户为中心,的方法,它通过整合IT服务与业务来提高组织IT服务支持 和服务交付的能力及其水平, 来源于国外信息组织与机构对于信息技术从管理向服务转,向过程的最佳实践, 希望将信息技术从成本中心转向
18、价值中心, 根本目的是改进服务,提高满意度,提升信息技术的价值 相关的国际标准与实践:ISO20000、ITIL、COBIT、,ISO27001、ISO17799等,数据中心运维的标准,ITIL, ITIL,(Information Technology Infrastructure Library) 信息技术基础架构库, ITIL被广泛的用于建立并提高组织的服务管理能,力。ITIL提供了一套业绩最佳实践来指导组织达 到ISO20000标准。促使组织使用正确的方法,通 过使用IT服务来达到业务的效力和效率。, Use ITIL in whole, or in part its up to yo
19、u,数据中心运维的标准,ITIL 简史, 在 20 世纪80 年代末期,英国商务部(OGC,Office,Government Commerce)发布了ITIL。, Version 1 19861999 年原始版,主要是基于职能型,的实践, Version 2 19992006 年 ITIL v2 版,主要是基于流程,型的实践, Version 3 20042007 年基于服务生命周期的实践,数据中心运维的标准,ISO 20000,5 大类,13个管理流程,数据中心运维的标准,ITSM三级阶段,数据中心运维的标准,12,真正有效的方法 信息安全管理体系(ISMS) 什么是信息安全管理体系? 信
20、息安全管理体系(Information Security Management System,ISMS)是 组织整体管理体系的一个部分,是组织在整体或特定范围内建立信息安全方 针和目标,以及完成这些目标所用方法的体系。基于对业务风险的认识, ISMS 包括建立、实施、操作、监视、复查、维护和改进信息安全等一系列 的管理活动,并且表现为组织结构、策略方针等诸多要素的集合: 组织架构 策略方针 计划与活动 目标和原则 人员与责任 程序, 过程与方法,数据中心运维的标准,安全策略的层次性,策略 Policy,最低标准,强制性 标准 Standard,建议性 指南 Guideline,基线 Basel
21、ine,程序 Procedure,13,数据中心运维的标准,14,ISO27001/ISO27002标准简介,英国标准协会(British Standards Institute,BSI)制定的信息安全标准,,目前已经成为ISO发布的国际标准, ISO 27001:信息安全管理体系规范用于为建立、实施、运行、监视、,评审、保持和改进信息安全管理体系(ISMS)提供模型。, ISO 27002:信息安全管理实施细则 本标准为在组织内启动、实施、保,持和改进信息安全管理提供指南和通用的原则。本标准概述的目标提供了 有关信息安全管理通常公认的目标的通用指南。,ISO27001/ISO27002标准内容框架,64,11个安全域39个安全控制目标和133个安全控制措施,11,65,第一层,第二层,第三层,第四层,安全方针/手册 - 管理体系的总括,管理流程 - 用以实施控制的 管理流程,操作规程 - 如何执行具体的 工作任务,记录表单 - 按照既有制度 执行的控制表单,典型的信息系统安全管理制度体系可以分为四个层面:体现管理层管理意愿的安全方针,确定基本管控要求的管理流程,指导具体操作的操作规程和执行表单。,数据中心安全管理制度体系,Thanks !,中科仙络信息化节能技术研究所公司,Syncloc Institute of Data Center Energy Efficiency,
链接地址:https://www.31doc.com/p-5187171.html