2019年机房环境集中监控系统.9.doc
《2019年机房环境集中监控系统.9.doc》由会员分享,可在线阅读,更多相关《2019年机房环境集中监控系统.9.doc(52页珍藏版)》请在三一文库上搜索。
1、 1 机房环境集中监控系统机房环境集中监控系统 方方 案案 第一章:服务器监控系统第一章:服务器监控系统 总体设计总体设计3 3 一、概述 .3 一)系统的必要性 .3 二)设计依据 .4 三)设计原则 .5 2 四)监控项目 .6 第二章第二章 机房集中监控系统机房集中监控系统 介绍介绍 7 7 一)概述 .7 二)系统特点 .8 三)系统软件平台介绍 .9 四)主要硬件组成 25 1)监控中心服务器: .25 2). 空调远程控制器(AIRC-485) .26 3)信息采集模块(MD82N) 27 4)温湿度变送器(TH100) 29 5)区域式漏水监控 LK1000 .30 6)智能协议
2、转换器(NCS1) .32 7).智能电量仪 34 8). 网络硬盘录像机 .36 9).彩色半球摄像机 39 10).门禁控制器 .41 第三章房集中监控系统方第三章房集中监控系统方 案设计案设计 4646 一)用户需求分析 46 二)解决方案 47 1.温湿度监控 47 2配电监控 .48 3市电监控 .48 4漏水监控 .49 5UPS 监控 49 6精密空调监控: 50 7烟雾监控: .51 8视频监控: .51 3 9门禁监控: .52 10门磁监控: 53 12红外监控: 53 附加说明:典型客户 54 第一章:服务器监控系统总体设计第一章:服务器监控系统总体设计 一、概述一、概述
3、 一)系统的必要性一)系统的必要性 随着计算机技术的发展和普及,计算机系统数量与日俱增,其配套的环 境设备也日益增多,计算机房已成为各大单位的重要组成部分。机房设备(供 配电、 UPS、空调、消防、环境、保安等)必须时时刻刻为计算机系统提供正 常的运行环境。一旦机房环境设备出现故障,就会影响到计算机系统的运行, 对数据传输、存储及系统运行的可靠性构成威胁,如事故严重又不能及时处理, 就可能损坏硬件设备,造成严重后果。对于教育、医疗、企业等需要实时交换 数据的单位的机房,机房管理更为重要,一旦系统发生故障,造成的经济损失 更是不可估量。 目前许多机房的管理人员不得不采用 24 小时专人值班,定时
4、巡查机房环 境设备,这样不仅加重了管理人员的负担,而且更多的时候,不能及时发现和 4 排除故障,对事故发生的时间及责任也无科学的管理, 尤其目前国内普遍缺乏 机房环境设备的专业管理人员,在许多地方的机房不得不安排软件人员或者不 太懂机房设备管理甚至根本不懂机房设备维护的人员值班,这对机房的安全运 行无疑又是 机房集中监控系统主要监控对象包括:供配电、照明、开关、电源防雷器、 UPS 、发电机、精密空调、新风机、漏水、温度、湿度、有害气体;消防控制 器、烟雾探测器、温感探测器、门禁、视频、防盗报警、主机、服务器、路由 器、交换机等设备。 二)设计依据二)设计依据 (1)计算机机房集中监控用户要求
5、 (2) 计算机场地安全要求 (3) 计算机站场地技术条件GB2887-89 (4) 工业企业通信接地设计规范GBJ79-85 (5) 安全防范工程程序与要求 GA/T75-94 (6) 智能建筑设计规范(GB/T 503142000) (7) 低压配电设计规范(GB 5005495) (8) 中华人民共和国公共安全行业标准(GA 247-2000) 三)设计原则三)设计原则 先进性:整个系统技术保持一定前瞻性,采用的设备和技术能适应将来的 科技发展。 实用性:系统性能价格比高,易维护、易使用、运行费用低。 扩展性:系统采用结构化设计,能够适应不断增加的扩展需求,当系统扩 容时,只需简单增加相
6、关设备即可。 5 兼容性:整个系统能监控不同的操作平台和语言环境,并能与不同厂商的 产品兼容。 灵活性:系统构成方式简单,功能配置灵活,充分利用现有的计算机资源, 能满足不同业务部门的需要。 实时性:系统图像、数据能通过网络实时传输与保存,用于日后的查询与 分析。 可靠性:所选设备具有良好的电磁兼容性和电气隔离性能,系统安全可靠 性高,有足够的抗干扰能力,不影响被监控设备正常工作。 可维护性:系统运行可在线运行诊断和检测,能及时发现系统各功能单元 故障情况,便于系统故障的维护处理。 四)监控项目四)监控项目 机房动力: 遥测:市电交流 220/380V 电压、直流 48V 设备用电电压。 遥信
7、:各种电压的上下限告警。 机房环境: 遥测:各房间的温、湿度、烟雾、漏水。 遥信:温度过高、湿度过高、温度过低、湿度过低,地面浸水状态, 烟雾的探测、房间的非法闯入等。 精密空调: 遥测:监控空调各部件(压缩机、风机、加热器、加湿器、除湿器、 过滤网等)的运行状态与参数,并可通过软件在系统上或通过网络远程修 改空调设置参数(温度、湿度、温度上下限、湿度上下限等)。 遥信:温度过高、湿度过高、温度过低、湿度过低等。 UPS: 遥测:输入电压、输出电压、输出电流、输出频率、负载、温度、变 频器、整流器、蓄电池等。 遥信:UPS 整体状态。 6 第二章第二章 机房集中监控系统介绍机房集中监控系统介绍
8、 一)概述一)概述 嵌入式网络安全平台 SMT6800 完美融合工控机的高可靠性、服务器的卓越性能,是一款高可靠 的网络安全与动力环境监控嵌入式应用型计算平台。 应用性强: SMT6800 是一款具有高性价比的网络安全与动力环境监控平台,网口采用 4 个 Realtek 8111D PCI-E 芯片,提供标准千兆网口,广泛适用于远程或分支办 公地点、中小规模企业 网络与动力环境监控的安全平台。 可靠性高: 采用工控机的高可靠性设计理念。机箱采用全钢结构设计,结构紧凑坚固, 卓越的抗冲击、抗振动性能。采用优良的散热结构设计,对进风口进行防尘海 绵防护,降低灰尘、散热、静电三大不稳定因素的影响。采
9、用高质量高可靠的 7 主板、硬盘,工控机专用电源,所有器件最小 MTBF50000h。 主要技术规格 SMT6800SMT6800 技术规格一览表技术规格一览表 机型19 英寸 1U 标准上架整机 网口4 个 Realtek 8111D PCI-E 芯片,提供标准千兆网口 其他接 口 2 个 USB 接口、1 个 RS-232 RJ45 串口,前面板有 LAN1、LAN2、LAN3、LAN4、HD、PW 指示灯 电源工控机电源 环境温 度 工作温度:-1055 , 存储温度:-4085 相对湿 度 非运行时 95%,于 2530温度下不凝结 噪声45DB MTBF50000h 二)系统特点二)
10、系统特点 Itmng 的主要功能特点: - 监视网络服务 (HTTP, PING 等) - 监视主机资源 (进程, 磁盘等) - 插件设计可以扩展 Itmng 的监视功能(如动力环境监控中的温度、湿度、电 压、电流等) - 服务等监视的并发处理 - 错误通知功能 (通过 email、电话、短信等方法) - 可选的基于浏览器的 WEB 界面以方便系统管理人员查看网络状态,各种系统 问题,以及日志等等 Itmng 的优点: - 良好的稳定的系统管理代码 - 在服务事件和主机事件之间良好的要相关性 - 命令检查配置文件的验证 8 - 命令重新加载配置文件无需打扰 Itmng 的运行 Itmng we
11、b 页面 一、ITMNG 登录 打开浏览器,输入地址: http:/IP/itmng(Itmng 监控服务器的 IP 地址)。 登录页面后,会看到 Itmng 默认页面的相关信息: 左侧显示的是操作按钮选项; 右侧是 Itmng 所有主机的网络图; 最上端左边是显示主机状态(运行、宕机、不可达、未决、总计)和服 务状态(正常、警报、严重、未知、未决、总计) ; 最上端右边是显示主机检查执行时间、主机延迟和服务检查执行时间、 服务延迟。 三)系统软件平台介绍三)系统软件平台介绍 Itmng 是一个监视系统运行状态、网络信息以及机房动力环境的监视系统。 Itmng 能监视所指定的本地或远程主机以及
12、服务,同时提供异常通知功能等。 Itmng 运行在 Linux 平台之上,同时提供一个可选的基于浏览器的 WEB 界面以 方便系统管理人员查看网络状态,各种系统问题,以及日志等等。 Itmng web 页面 一、ITMNG 登录 打开浏览器,输入地址: http:/IP/itmng(Itmng 监控服务器的 IP 地址)。 登录页面后,会看到 Itmng 默认页面的相关信息: 左侧显示的是操作按钮选项; 右侧是 Itmng 所有主机的网络图; 最上端左边是显示主机状态(运行、宕机、不可达、未决、总计)和服 务状态(正常、警报、严重、未知、未决、总计) ; 9 最上端右边是显示主机检查执行时间、
13、主机延迟和服务检查执行时间、 服务延迟。 二、选项说明 1、搜索 在“搜索-显示主机-方框 ”内输入主机名称后回车,搜索相关的主机, 会显示对应主机的服务状态细节。 2、状态 状态选项包括“状态图” 、 “主机详情” 、 “服务详情” 、 “主机组概述” 、 “服 务组概述” 。 下面针对“状态”下面的选项的功能做具体的说明。 (1) 、状态图 如下图可以看到网络拓扑结构。 (2) 、主机详情 显示的是主机存活状态详细信息。如下图所示: 红色部分,表示是告警的主机,点击对应的主机名称可以直接跳到告警主 机的详细信息部分。 10 当前网络状态:列出当前网络的状态,上次更新的日期以及登录的用户 名
14、称等; 服务检查命令:各主机最后面的方框中勾选,在此项中下拉可选不同的 检查命令; 主机:列出所有的主机名称; 状态:列出所有主机的存活状态; 最近检查:上次检测时间; 持续时间:运行持续时间; 尝试:尝试检查次数; 状态信息:相关状态信息。 主机名旁边有 3 个快捷方式,单击分别可显示主机 PING 的性能 数据(小太阳) 、主机状态信息、服务状态详情(下同) ; 图中右上角有 3 个快捷方式,单击可分别显示 3 种格式输出 的状态细节(下同) 。 (3) 、服务详情 单击“状态-服务详情” ,如下图所示: 11 当前网络状态:列出当前网络的状态,上次更新的日期以及登录的用户 名称等; 服务
15、检查命令:各服务最后面的方框中勾选,在此项中下拉可选不同的 检查命令; 所有主机的服务状态细节:列出所有的主机和服务相关状况的详细信息, 包括:主机、服务、状态、最近检查、持续时间、尝试、状态信息。 如果想查看相关信息,我们可以点击主机或服务列出的主机和服务名称 进行查看。 12 点击上图中主机列的任意一主机名称如下图所示: 左上侧超链接: 13 查看该主机状态详情 查看该主机警告历史 查看该主机趋势 查看该主机警告柱状图 查看该主机可用性报告 查看该主机通知信息 主机状态信息: 主机状态:主机存活的状态,运行、宕机; 状态信息:状态信息; 性能数据:性能数据信息; 当前尝试:目前的尝试次数;
16、 最近检查时间:最后检测时间; 检查类型:检测类型; 检查延迟持续时间:延时检测/持续检测; 安排下一次主动检查:下次计划主动检测时间; 最近状态变化:上次状态改变时间; 最近通知:上次告警时间; 主机拌动:主机是否抖动,即反复出现故障,或刚从故障中恢复; 在安排宕机中:是否计划宕机; 最近更新:上次更新时间。 主机命令: 在地图上定位主机:在状态图上显示主机; 禁用该主机主动检查:不主动检测这台主机; 重新安排下次主机检查:下一次计划检测这个主机,选中后可以自定义 时间和是否强制检测,提交后执行即生效。这里默认的检测时间是距当 前时间; 提交该主机被动检查结果:为这个主机提交被动检测结果;
17、14 停止该主机接受被动检查:停止接受被动检测此主机; 停止强近该主机:停止被困扰的主机; 禁用该主机通知:不显示主机告警通知; 发送自定义通知:发送自定义主机告警; 安排该主机宕机时间:为主机自定义停机时间,维护主机或者割接时常 用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时 间到期时,将发出通知些主机。里面会有起始时间和终止时间,可以选 择固定或弹性停机,此功能需重点掌握,比较常用; 禁用该主机上的所有服务通知:本机上的所有服务不启用告警; 启用该主机上所有服务通知:本机上的所有服务启用告警; 安排该主机上所有服务检查:计划为本机检测所有的服务,用来排定下 次检查所有服务指
18、定的主机,可以强制检查; 禁用该主机上所有服务检查:禁用为本机检测所有的服务; 启用该主机上所有服务检查:与上面的相反; 禁用该主机事件处理:用来暂时阻止 Itmng 主机运行事件处理程序; 禁用该主机抖动检测:停止本机抖动检测; 添加新主机注释:为主机添加新注释。 主机注释: 该主机的相关注释; 安排主机宕机: 安排与主机相关的宕机。 “服务状态信息和服务命令”的说明同上,只是把主机名称改为服务而已, 这里不做特殊说明。 15 (4) 、主机组概述 所有的主机按群组显示相关的信息,主机相同的群组显示为一组,如下图 所示: 主机:主机名称; 状态:该主机存活状态; 服务:显示服务检测结果; 动
19、作:下面 4 个图标为快捷方式。 查看所有主机组状态汇总: 显示所有的主机群状态摘要。如下图所示: 主机组:列出所有的主机群名称; 主机组状态汇总:主机状态摘要统计; 服务状态汇总:服务状态摘要统计; 查看所有主机组的服务状态网格: 主机群组以网格的方式显示。如下图所示: 16 (5) 、服务组概述 服务组概述说明同主机组概述,只是将服务组名称变成主机组而已,没有 本质区别,具体说明请参考服务组概述。我们目前没将服务进行分组,所以关 于服务分组的部分全部是空的。 查看所有服务组的状态汇总: 所有服务组的状态汇总说明同所有主机组的状态汇总; 查看所有服务组的服务状态网格: 所有服务组的服务状态网
20、格说明同所有主机组的服务状态网格。 3、故障 (1) 、服务故障 主机上的所有服务告警信息,包括不可达的所有服务信息,如下图所示: 上图所述的字段前文都有说明,这里不做解释。 (2) 、未处理服务 主机上未经过处理的服务告警信息,如下图所示: 17 (3) 、主机故障 主机存活告警信息,同上。 (4) 、未处理主机 显示未经过处理的主机告警信息,同上。 (5) 、所有未处理故障 显示所有未经过处理的告警信息,同上。 (6) 、网络中断 显示网络中断的信息。 4、系统 (1) 、注释 主机注释 服务注释 (2) 、宕机 安排主机宕机 安排服务宕机 (3) 、性能信息 显示计划的性能信息,包括主机
21、的主动检测和被动检测;服务的主动检测 和被动检测;检查统计;缓冲区使用状况。如下图所示: 18 (4) 、 进程 信息 (It mng 进程信息) 进程信息中显示进程的状态和进程命令,如下图所示: 19 关闭 Itmng 进程:关闭 Itmng 的进程,此命令是用来关闭 Itmng 进程。 请注意:一旦 Itmng 已关机,无法通过网络接口启动! 禁用通知:不显示告警信息。此命令是用来关闭所有的范围内的主机和 服务告警信息。 (5) 、检查调度队列 显示高度队列信息,也就是相关进程下次检测的时间序列。如下图所示: 5、报告 (1) 、趋势 20 生成报告的趋势,可以按主机或服务来生成,共分为三
22、个步骤: 1.选择主机或服务名称; 2.选择主机或者服务的具体名称; 3.选择报告选项,此选项包括报告的起始和结束时间,初始化状态等; 如下图所示:单击图形中的区域可进行放大缩小等相关操作。目前的图形 只做出了框图,以不同颜色标识服务或主机的状态,还需要一些工作量才能显 示曲线图。 (2) 、可用性 此功能生成的报告要比趋势可供选择的种类多些,除了趋势可供选择的功 能之外,还包括:对所有主机生成报告 对所有服务生成报告 对主机组和服务 组生成报告,下图是对主机和服务生成的报告: 21 (3)、警告汇总 以告警直方图方式显示,其功能类似趋势选项的功能,只是直方图的方式 显示相关的信息,如下图所示
23、: (4) 、警告历史 是显示历史告警的信息,可以针对具体告警信息进行过滤,如下图所示: (5) 、警告概要 22 显示相关的告警摘要的信息,可以针对主机,服务,主机群和服务群进行 查询,也可以进行跨区域的查询,比如:最近 24 小时,最近七天,最近一个月 等的查询。 (6) 、通知 查询当天的告警和恢复告警的信息,也可以按向左的前头查询上一天或更 早的告警信息。 (7) 、事件日志 是按每小时显示 Itmng 的日志信息,显示有些类似与警告历史。如下图所示: 23 6、配置 查看配置 是显示 Itmng 视图配置查询,具体功能选项包括:主机,主机依赖,服务, 服务依赖,主机群组,服务群组,联
24、系人群组等,查看配置的选项比较多,在此 不一一列举,只选择其中的一项做为截图,有兴趣的可以直接选择其它的选项 进行查看,顺便提醒一下:里面有个比较好的功能,可以当通讯录来使用,比 较直观,易懂。如下图所示: 24 四)主要硬件组成四)主要硬件组成 1 1)监控中心服务器:)监控中心服务器: SMT6800 完美融合工控机的高可靠性、服务器的卓越性能,是一款高可 靠的网络安全与动力环境监控嵌入式应用型计算平台。 应应用性用性强强: SMT6800 是一款具有高性价比的网络安全与动力环境监控平台,网口采用 4 个 Realtek 8111D PCI-E 芯片,提供标准千兆网口,广泛适用于远程或分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 机房 环境 集中 监控 系统
链接地址:https://www.31doc.com/p-2491177.html