信息化系统运维方案.doc
《信息化系统运维方案.doc》由会员分享,可在线阅读,更多相关《信息化系统运维方案.doc(39页珍藏版)》请在三一文库上搜索。
1、信息化系统运维方案信息化系统运维方案 一、项目概述 建设有独立机房和办公网络,业务系统多,存储数据量庞大。各单位的信息系统各不相同,依赖的网络运行环境也各不相同,对网络的管理策略与网络安全管理要求非常高。为确保单位存储数据、设备设施、资产资源的有效、安全、稳定的运行,必需要建立合理、规范、适用的组织管理体系,并能有效展开实施的运维管理体系和方法,从应用管理、数据管理、资产管理、资源管理、安全管理、配置管理、环境管理、应急响应等方面对主机、网络、数据库、存储、数据等信息系统重要设施和资源进行运维管理,最终确保信息系统的安全、稳定的运行,为正常的办公及业务办理提供坚实的支持。 二、服务内容及要求
2、运维管理方案含运维服务团队管理、运维服务工作管理、服务台管理、运维服务工作制度的建立和完善运维服务流程规范运维服务工具的完善、运维服务体系的评估和改善、运维服务咨询等主要内容。 资产保管、建立资产档案、资产标识、资产核查、资产变更、流程规范等。 1基础网络环境运维:运行状态监控和预警、定期巡检维护、机房应急演练、网络安全检测、开关机、故障处理、网络接入、调整网络及优化、设备及线缆标识、配置信息备份管理、技术文档管理等。 2操作系统运维:运行状态监控和预警、定期巡检维护、故障处理、调整优化、配置信息备份管理、技术文档管理等。 3数据库系统运维:运行状态监控和预警、定期巡检维护、数据安全检测、开关
3、机、故障处理、调整优化、配置信息备份管理、技术文档管理等。 4中间件系统运维:运行状态监控和预警、定期巡检维护、故障处理、调整优化、配置信息备份管理、技术文档管理等。 5数据存储系统运维:运行状态监控和预警、定期巡检维护、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理等。 6数据备份系统运维:运行状态监控和预警、定期巡检维护、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理等。 7容灾备份环境运维:运行状态监控和预警、定期巡检维护、开关机、故障处理、调整优化、配置信息备份管理、技术文档管理、容灾恢复方案、容灾恢复演练、容灾恢复等。 8虚拟机平台运维:虚拟化平台运行状态监控
4、和预警、定期巡检维护、故障处理、调整优化、配置信息备份管理、技术文档管理、虚拟机搭建等。 重大活动确保服务:方案制定、组织协调、活动前调试、活动中确保、活动后总结、流程规范等。 5.容灾备份业务系统数据库异地备份 1依据甲方数据异地备份的必需求,提供异地备份服务、软件及备份方案; 2针对甲方所有应用系统数据库搭建实时在线数据复制灾备系统; 3灾备支持oracle,sqlserver数据库; 4灾备支持aix,linux,windows操作系统; 5灾备系统软硬件,由乙方提供; 6软硬件产权双方必必需确保软硬件产权合法性,甲方不承当任何产权纠纷。 6.1 数据库运维 1优化完善数据库管理规范 参
5、加优化完善甲方现有数据库管理规范,并且能在合同签订后1个月内提交甲方认可的规范可行的修改补充文本电子1份及纸质2份,包涵但不限于以下内容: 日常运维方案,包涵日常运维工作人员、人数、场地、方式、工作内容、沟通方式、评分考核机制等。 定期巡检方案,包涵巡检的周期、次数、人员、方式、内容、报告提交、客户评价、巡检发现问题处理机制等。 数据备份恢复方案,包涵数据备份恢复的目标、技术手段、配备的软硬件环境、备份恢复耗时、正确性检验、故障预先应对脚本等。 数据容灾及演练方案,包涵数据容灾的目标、技术手段、配备的软、硬件环境、容灾的实时性/稳定性/安全性的测评、周期的演练等。 系统性能监控方案,包涵系统性
6、能监控的项目、采纳的工具、监控指标的制定、监控数据的采集/分析/存档、监控发现问题处理机制等。 故障应急处理方案等,包涵各种故障的分类、定义、影响范围、应对方式、应对时效、数据抢救程度、事件分析、处理方案改善机制等。 配合甲方定期对各种方案进行演练。评估和掌控各种方案的效果和处理时间,并依据客户环境的及时变幻调整方案,演练结束后出具评估结果。 及时更新数据库运维列表、出具运维月报,评估甲方所有数据库运维现状、潜在风险、解决计划、应急方案等内容。 2数据库安全服务 依据日常服务或专项工作发现潜在隐患,跟踪原厂产品动态,收集安全补丁信息,对各类风险进行评估,提出数据库升级建议及实施方案,并依据客户
7、时间安排实施完善升级;设置数据安全参数,限制数据库在合理的特定范围内开放,依据安全检测报告等对数据库进行优化。 3数据库安装配置及迁移 基于AIX、SOLARIS、HP-UNIX、LINUX、WINDOWS 等所有平台安装单库、集群、DA TA GUARD 数据卫士、HA 双机等各种环境,依据系统业务特征、数据量、OS 状况、主机状况、存储状况、网络状况等制定出最正确数据库配置,并生成报告;同时依据甲方要求,无论软件升级、硬件改换、数据库升级、数据库改换、存储改换、灾备改换等可能碰到的各种状况,均能提供完善快速的数据迁移服务方案,协助甲方实施并生成有关文档。 4数据库故障紧急救援服务 依照系统
8、是否能够正常运行、数据是否遭到破坏,划分故障级别,制定服务细则,定制不同状况下的数据抢救方式。故障出现30分钟内到达现场,1小时内解决,超过1小时驻场工程师仍然不能解决问题的,乙方专家接到通知后,在1小时内抵达现场进行紧急救援, 并且在1小时内完成故障处理,恢复服务。 当发生突发性故障时,乙方能够按照相应处理流程在规定的响应时间内快速排查解决,最大程度的抢救数据,确保数据完整性。同时协助甲方对数据库所在整个软硬件环境出现的问题,进行故障排除。并按甲方要求,及时形成事故处理报告及改善看法。 5数据库性能诊断及调优 数据库性能诊断及调优由具有丰富工作经验的资深工程师对数据库随着业务周期进行监控,数
9、据库性能诊断及调优在现场实施,每年六次每两个月一次,包括但不限于以下内容: 1)会话数、活动会话数、会话打开的游标数; 2)系统压力指标,redo 产生量、Logical reads、Block changes、Physical reads、Physical writes、User calls、Parses、Hard parses、Sorts、Logons、Executes、Transactions; 3)命中率指标,Buffer Nowait %、Redo NoWait %、Buffer Hit %、In-memory Sort %、 Library Hit %、Soft Parse %、E
10、xecute to Parse %、Latch Hit %、Parse CPU to Parse Elapsd %、% Non-Parse CPU; 4)共享池的使用状况,Memory Usage %、% SQL with executions1、% Memory for SQL w/exec1; 5)最消耗资源的等待事件的具体信息; 6)RAC 环境下,Global Cache Service - Workload Characteristics、Global Enqueue Service Statistics、GCS and GES Messaging statistics,此3 个大类
11、下的几十个子指标的值; 7)RAC 环境下,GES Statistics for DB,次大类下几十个子指标每秒、每事务、合计的 值; 8)最消耗资源的SQL,分别从请求获得内存数量、读数据块数量、执行次数、解析调 用次数、子版本数量角度抓取; 9)实例活动统计,Instance Activity Stats for DB,次大类下几十个子指标每秒、每事务、 合计的值; 10)热点表空间的I/O 统计信息; 11)热点数据文件的I/O 统计信息; 12)锁,即数据库中各种队列的信息,包括锁类型、请求次数、得到次数、失败次数、 等待时间等; 13)回滚段的使用信息,Undo Segment,此大
12、类从不同面进行的统计状况; 14)栓锁的使用状况,Latch Activity for DB,包括锁类型、请求次数、得到次数、失败 次数、等待时间等; 15)SGA 各个子缓冲区的使用状况,比如Dictionary Cache、Library Cache、Shared Pool 等区域中内部使用时信息,包括请求类型、请求次数、得到次数、失败次数、等待 时间等; 16)磁盘排序状况,热点表等; 17)抓取资源消耗排列靠前的用户清册、运行脚本。 18)对各种性能监控统计信息进行分析,查找、诊断应用系统数据库中存在的性能瓶颈; 针对应用系统数据库存在的性能瓶颈进行调整包括对数据进行分区存储,提升 系
13、统运行效率。并对监控调优过程生成完善的文档报告。 6数据库数据备份、恢复及归档日志挖掘 数据库性能诊断及调优由服务商具有丰富工作经验的资深工程师依据用户的具体环境,每年不少于两次对各应用系统进行备份数据可用性测试,每年协助甲方进行不少于两次数据备份恢复演练每次演练随机抽取应用系统数据进行数据备份恢复,包括但不限于以下内 容: 1)制定切实可行的数据库备份、恢复及归档日志挖掘方案,验证备份文件有效完整性; 2)定期测试备份数据的有效性; 3)协助甲方进行应用系统数据恢复演练,通过具体的恢复实验,协助甲方验证具体的 备份是否有效,以及演示如何使用备份进行不同级别的恢复; 4)依据甲方要求,对指定的
14、归档日志进行挖掘,还原操作痕迹; 5)周期性评估数据增量、备份时间变化、恢复时间变化,依据变化调整备份恢复策略; 6)生成全面的备份恢复机制文档、应急处理文档、操作过程文档等。 7数据库定期现场巡检 每年派二线人员进行现场巡检4 次,每三个月1次,在甲方人员现场进行健康巡检,每次巡检不少于1周时间,并于巡检结束后3日内提交检查报告。报告包括但不限于如下内容: 1)运行状况; 2)数据库对象有效性,空间使用及规划、是否必需要安装新的补丁、网络连接状况; 3)数据库健康检查,提交检测报告。 4)数据库运行状况进行调整或提出调整建议。 5)数据库存储容量变化,对存储配置和数据备份与恢复进行调整或提出
15、调整建议。 6)变化状况,对数据库配置参数进行调整或提出调整建议。 7)依据系统负荷状况,对操作系统、数据库配置进行调整或提出调整建议。 8)针对数据库性能指标参数或应用系统特别问题,提出特别表的维护建议。 9)针对应用系统特别问题,提出应用软件制定及代码层的调整建议。 10)巡检中发现的各种隐患的处理报告。 11)乙方安排的各种其它事项的处理报告。 乙方对数据库可能存在的性能问题进行全面的分析、评估和调整,以确定在系统软件层面上存在的主要性能瓶颈和隐患,在性能诊断基础上,对数据库进行性能调优,以提升应用系统的整体性能。同时协助甲方对数据库所在的整个软硬件环境存在的性能问题,进行相应的诊断和性
16、能调优,并提出相应的优化建议和看法。 8Oracle 数据库管理常规培训及知识转移 1)Oracle 常规培训:依据甲方培训必需求,供应商每年对甲方相关技术人员进行一次数 据库技术培训,培训时间不少于5 天。培训地点和实际操作环境由甲方提供。乙方 负责提供师资。 2)知识转移应包括但不限于知识的共享和知识的汲取两个阶段。乙方可通过现场授课、 面对面交流、即时通信工具、电子邮件等途径、转移有关经验知识、同时有义务向 甲方人员提供有关的帮助文档、文献资料、软件工具等,同时供应商指导机房人员 将知识运用到工作中,帮助甲方人员实现知识的汲取。 9开发咨询、开发技术方案审核 开发技术方案审核由具有丰富工
17、作经验的资深工程师依据甲方要求,给出审核看法和建议,出具审核报告,包括但不限于以下内容: 1)技术咨询,技术指导; 2)协助开发人员进行数据库端程序的调试; 3)代码优化,优化原则的培训; 4)技术实现方式的改良建议; 5)数据库端程序的制定; 6)系统布暑等技术方案; 7)数据通讯等技术方案; 8)数据容灾等技术方案; 9)数据备份恢复等技术方案; 10)数据安全等技术方案; 从技术可行性、性能评估等方面给出看法和建议。 6.2 数据库安全建设 数据安全建设必需要达到以下目标: 1)提升现有业务信息系统数据库的系统安全性,检查和验证数据库在运维开发过程中 预防数据泄露、预防误操作、非法SQL
18、 注入等操作,实现对第三方运维开发人员 对数据库准入、访问控制、事后审计,拟利用技术手段来规范数据库管理员和开发 人员的访问行为,保护敏感数据不泄露。 2)提供数据库安全策略,围绕着核心数据安全构建全新的信息安全防御体系。 3)建立数据脱敏,利用其敏感数据自动发现功能、对敏感数据按必需进行漂白、变形、 遮盖等处理,避免敏感信息泄露,同时又能确保脱敏后的输出数据能够坚持数据的 一致性和业务的关联性。 4)建立操作系统、硬件设备、中间件和数据库智能化、一体化监控,7*24 小时无值守 自动巡检,运维云线上远程DBA 告警派单和技术支持服务交付。 乙方依据自身实际状况与技术能力提供建设方案,如建设必
19、需用到第三方软件或硬件,乙方必必需确保软硬件产权合法性,甲方不承当任何产权纠纷。 6.3 依据甲方实际状况定制开发数据库管理软件 1)软件监控内容:数据库性能监控、数据库主机性能监控、数据库日志监控、数据库 服器日志监控、数据库对象监控、数据库健康状况监控、数据库故障预警、表空间 使用状况、磁盘使用状态; 2)能依据时间段,性能指标选择生成数据性能状况分析图; 3)能依据时间段,生成系统健康状况分析报告; 4)软件监控数据要求至少储存两年; 5)软件产权归乙方,服务期内甲方拥有使用权。 信息化建设由多个服务单位实施,每个建设单位只负责对应承建的项目建设,建设过程缺乏统一的管理与协调。由于各个项
20、目的建设周期与建设时间不一致,所以整体信息化目前仍存在一些不够。乙方必需要依据数据机房现状、网络机房现状、智能建设现状、弱电建设现状分析目前建筑信息化存在的不够与必需要调整的地方,制定数据机房、网络机房、弱电的网络完善方案并予以实施。乙方必需按排工程师与所有建筑信息化建设公司对接,由于部分项目已经过了项目免费保修期,甲方只负责提供建设公司对应的联系方式与尽量协调建设公司配合提供技术支持,具体技术对接与方案制订必需乙方自行完成。乙方网络完善实施完成后必需要提供所有安装规划文档与运维手册给甲方运维管理部门。 为确保建筑网正常运行与网络安全,要求服务公司提供:网络运维管理、网络监管软件、网络入侵检测
21、设备、运维网络安全隔离设备。网络安全管控所有软硬件产权归乙方,乙方必必需确保软硬件产权合法性,甲方不承当任何产权纠纷。 8.1网络监管软件:、 1软件功能要求:告警管理、性能管理、拓扑管理、配置文件管理、网元管理、链路管理、VLAN 管理、日志管理、物理资源、电子标签、IP拓扑、智能配置工具、自定义设备管理、安全管理、终端资源管理、设备软件管理、系统监控工具、故障采集; 2软件性能要求:满足大型网络管理要求,能提供全方位的网络业务管理,可管理5000个网络设备。 8.2入侵检测设备: 1全面检测:覆盖网络、服务器、终端及应用; 2具备IDS 的检测能力:漏洞攻击、Web 应用攻击、蠕虫木马等恶
22、意软件、网络DoS 等; 1)3具备检测使用人员网客户端攻击的功能浏览器、媒体文件、各种文档格式 等; 4具备应用用层拒绝服务攻击及预警功能(HTTP、DNS、SIP 等); 5具备应用感知能力,自动识别应用帮助用户掌插网络真实状态,漏洞跟踪的能力,及时发现攻击,提供及时处理功能; 6具备完善的报表展示功能: 1)详实的报警信息,同时提供针对性的响应指导措施; 2)可进行攻击录包,帮助用户更清楚的了解黑客行为过程并进行采证。、 3)提供各种安全报表,让用户轻松掌插内部安全状态及趋势; 4)提供各种的预定义策略,可以满足定制化策略的必需求; 5)提供各种的日志统计报表功能,从不同粒度和不同维度全
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息化 系统 方案
