大唐乌沙山DCS系统应用维护情况交流.pdf
大唐乌沙山电厂 DCS 系统应用维护情况交流 冯博 罗新宇 大唐浙江乌沙山发电有限公司 1 DCS 系统简述 大唐浙江乌沙山发电有限公司一期工程 4×600MW 工程采用上海福克斯波罗公司提供的 I/A Series 系统,实现了一体化设计,共包括 MCS、SCS、DAS、FSSS、DEH、ETS、MEH 七个系 统。每台机组配置 22 对 CP60 控制处理机,4 台操作员站,2 台工程师站;二台机组作为一个单元 配置 2 对 CP60 控制处理机,1 台工程师站组成单元公用系统控制系统,并分别与相邻机组 DCS 系 统连网。DCS 系统操作员站与工程师站均采用 SUN 公司 UNIX 系统,能有效防止 Windows 病毒的 攻击,每台机组实际配置点数为机组 I/O+远程 I/O=10196 点。 2 DCS 系统故障分类描述 自 2006 年机组正式投产以来 DCS 系统整体表现性能较为稳定,可靠;但是也发生过多次较为 严重的异常现象, 由于处理及时得力没有对机组正常运行造成不利的后果。 我公司 DCS 系统故障按 照设备类型可以分为四类: 2.1 FBM I/O 卡件故障: (1) 机组投厂初期各台机组部分 FBM 卡件频繁报警 A 路或 B 路通讯故障,更换备件后不 在报警;由于 FBM 为 A/B 路冗余通讯配置,故没有对正常运行造成影响。厂家对该故障解释为上 述报故障的卡件是由于出厂上电烧卡时间过短造成的,只存在个别卡件中,不影响使用。2007 年中 对故障卡件更换完毕后该类故障基本不在发生。 (2) FBM201 8AI 与 FBM204 4AI/4AO 模拟量卡每年会发生二起左右通道故障,故障通道 信号线 4- 20MA 电流正常, 但是 DCS 显示该通道信号为坏点。 需将信号线更换到备用通道恢复信号 正常,条件许可的情况下可以直接更换 FBM 卡件恢复正常。我厂所采用的 FBM 智能卡件均采取单 点 A/D 隔离技术,卡件单个信号通道的故障不会影响到其它相邻通道。上述卡件通道故障发生的原 因为卡件本身的质量问题。 2.2 FIELD BUS 通讯回路故障: (1) 设备报警 FIELD BUS 通讯回路 A 路或者 B 路故障, 在 SYSTEM 中进行手动强制网络 切换不能成功, 就地观察 FCM 卡件四个通讯指示灯熄灭不再闪烁, 更换 FCM 备件后系统恢复正常。 故障原因为 FCM 质量问题。 (2) CP12 和公用 CP01 下都设置了远程 I/O 点,远程 I/O 与 CP 通讯采用光纤方式,就是 在 FIELD BUS 回路上设置了光电转换器,远程 I/O 机柜内部还是采用 FCM 同轴电缆通讯方式。通 过一段时间的应用上述 CP 控制处理机经常报警 FIELD BUS 通讯回路 A 路或者 B 路故障,但是很 快就自修复;故障频繁报警一段时间后会导致 FCM 通讯卡故障,更换备件后正常一段时间,过一段 时间后依然发生此前的故障现象。最后经过更换 FIELD BUS 回路上的光电交换机才消除了该故障, PDF 文件使用 “pdfFactory Pro“ 试用版本创建 www.fineprint.cn FCM 也不在损坏。经过一段时间的应用我们认为原配的 FOXBORO 光电交换器可靠性差,平均使 用一年后就会发生故障, 导致 FIELD BUS 回路通讯故障; 我们将之改造为更加可靠的赫斯曼光电转 换器近二年来没有发生一起类似的故障。 2.3 NODE BUS 节点总线通讯故障: 大唐浙江乌沙山发电有限公司 2,3 号机组发生过数起 DCS 网络人机界面瘫痪事故,故障前机 组运行一切正常,发生后操作员站画面切换与操作速度首先变慢,接着参数点大面积出现蓝点(参 数点通讯故障现象) ;但是此时 CP 控制器与 FBM 卡件运行正常。故障状态下对 DCS 系统进行 NODEBUS 测试不能成功, 需将工程师站重启动后方能恢复正常。 该类故障发生的原因是我厂 DCS 系统 NODEBUS 与 CP 的负荷率均偏高,导致在运行一段时间后容易发生由于数据通讯错误,致使 节点总线通讯负荷进一步加大,直至阻塞,从而导致操作员站与工程师站等人机界面发生瘫痪的异 常事件。 为了避免该类型故障再次发生我们也针对性的做了一些工作: (1) 优化节点总线网络接入方式: 按照 I/A Series 系统的硬件说明一个 NODE BUS 节点总线 基于总线上的阻抗负荷, 一个节点中的每段最多允许的物理组件数为 32 个, 所有容错或冗余对计算 为 2 个组件,节点总线扩展组件对也计算为 2 个组件。我公司单台机组节点总线分为 2 段,1、4 号 机组每段带 11 对冗余 CP,也就是说加上 NCNI 扩展卡每段物理组件数为 24;而 2、3 号机组一段 带 15 对冗余 CP,另一段带 7 对冗余 CP;最大的一段加上 NCNI 扩展卡物理组件数达到了 32 的上 限,且该段中包括了负荷最重的 MCS 和 DAS 的 CP。所以,CP 卡件接入节点总线方式的不合理一 定程度上加重了节点总线的负担。我们按照 1、4 号机组的节点分布对 2、3 号机组进行了优化。 (2) 优化 SIS 系统数据读取程序:原 SIS 数据库软件采用 SIS 厂家自己开发的软件,采样死 区,采用周期均较小,没有采用例外报告的形式对数据进行读取,占用了大量的节点总线负荷;曾 经在 2 号机组停机时进行试验,SIS 系统开启时节点总线负荷达到了 17%,SIS 关闭后节点总线负 荷为 8%;SIS 占用节点负荷达 6%。而 I/A Series 系统一般要求系统节点总线负荷在高峰通讯期间 不超过 15%。针对这个问题我们将 SIS 数据采集程序改为 FOXBORO 公司自己开发的程序,它充 分利用了 I/A Series 系统的特点,提高了软件兼容性,占用节点总线负荷大大降低。 (3) 优化配置 CP 控制处理机组态点分布:按照 I/A Series 系统的要求单个 CP 内与其它 CP 的通讯点数一般不能超过 300 点,而我公司某些 DAS 系统 CP 通讯点最高达到了近 1500 余点,远 超过设计值,不但加重了 CP 的负担,由于通讯流量和错误率的上升也造成了节点总线负荷的增加。 我们对不使用的组态点进行删除,对需要使用的组态点尽量更换到其它相关的 CP 去,将单个 CP 的通讯点控制到 300 以内。 (4) 纠正节点总线 A/B 网接入方式:通过检修期间的 DCS 网络切换试验发现接入节点总线 SWITCH 交换机的 NCNI 和 RCNI 存在 A/B 网光纤接入错误的问题,一旦 NODE BUS 单网运行的 情况下,涉及的 CP 或人机界面会首先出现通讯故障,经过一段时间后会导致其它人机界面出现类 似的通讯故障。 我们对上述安装问题进行纠正后, DCS 网络切换正常。 由于 I/A Series 系统的 NODE BUS 节点总线采用 IEEE 802.3 协议,使用带冲突检测的载波侦听多路访问(CSMA/CD),在 A/B 网 络 SWITCH 交换机中定义了相关 IP 地址和网络信息,如果某些 NCNI 和 RCNI 存在 A/B 网接入错 误,在 A/B 均正常的情况下,同样的信息会在 A/B 网回路上均来回一次,虽然最终被接收,但是加 重了节点通讯负荷;一旦出现单网运行的情况,对应的人机界面或 CP 不能正确接收或发送信息, 错误信息的增多经过一段时间后加重整个节点总线的负荷,最终导致其它正常的人机界面通讯速度 也降低。 PDF 文件使用 “pdfFactory Pro“ 试用版本创建 www.fineprint.cn 2.4 CP 控制处理机故障: (1)MCS 系统的 CP 处理机由于负荷偏高,出现单 CP 离线故障后某些情况下不能自动复位, 人工单 CP 硬复位也不能成功;需要检修时进行双 CP 复位,才能恢复故障。 (2) FIELD BUS 回路的 FCM 故障频繁发生会导致对应的 CP 控制处理机单 CP 离线, 需在处 理完毕 FIELD BUS 回路通讯故障后,单 CP 硬复位下线 CP 恢复正常。 3 典型案例 1)2007 年 11 月 28 日 2 号机组 MCS 系统的 CP2001 单 CP 下线导致节点总线上通讯负荷过 大,协调以及给水画面蓝点无法操作和监视,无法进入 SYSTEM ,AW2001 和 WP2001- WP2004 进行重新启动后, 仍不能解决, 紧急与网调申请, 保持 580MW 负荷稳定不变, 并立即通知 FOXBORO 公司派专门服务工程师到现场,对下线的 CP 单 CP 硬复位后恢复正常。 2) 2007 年 12 月 12 日 1 号机组 CP1001 单 CP 下线且无法自动上线, 单 CP 硬复位不能成功, 该 CP 失去容错。此后利用机组检修时机进行双 CP 硬复位后恢复正常。 3) 2007 年 12 月 18 日 1 号机组 CP1006 单 CP 下线且无法自动上线, 单 CP 硬复位不能成功, 该 CP 失去容错。此后利用机组检修时机进行双 CP 硬复位后恢复正常。 4)2007 年 07 月 13 日 2 号机组 CP2012 报警 FCM A/B 线故障,单 CP 下线。所辖循环水泵 系统画面出现蓝点,失去监视和操作,更换 FCM 后未能恢复正常,由于该 CP 涉及远程 I/O 点,更 换光电交换器后恢复正常。 5)2008 年 01 月 10 日 3 号机组 CP3016- cp3022 下所带的 FBM 和 FCM 都不能正常显示,系 统报警红色,操作员站和工程师站速度变慢,7 对 CP 所带的设备数据无法上传,机侧的 TSI,DEH,ETS 以及电气的 ECS 画面蓝点,运行人员失去监视和调整。重新启动 AW3001 工程师站 后恢复正常。 6)2008 年 04 月 24 日 4 号机组 CP4004- CP4007 矩阵电源的第一块电源(二路电源进线,共 四块电源)故障。重新插拔电源后不能恢复,将故障电源拔出,更换备件后恢复正常。 7、2008 年 03 月 02 日 3 号机组 CPB001 报警 FCM A 线故障,单 CP 下线。更换 FCM 后未 能恢复正常,由于该 CP 涉及远程 I/O 点,更换光电交换器后恢复正常。 7、2008 年 05 月 26 日 2 号机组早 07 时 30 分左右接当值运行人员通知 2 号机组 SIS 系统停 止工作,协调系统历史数据停止更新,WP2003操作员站DCS画面监视点数据失去,无法进行监视和操 作,剩余操作员站速度相对变慢,但是目前还不影响监视和操作,机组稳定运行,各项自动调节正常. 故 障发生后,热工人员迅速赶到现场,发现现场情况与运行人员描述基本一致,在工程师站 AW2001 检 查发现系统报警 BAD CBL B(CABLE 总线 B 路故障),B 路光纤交换机信号 TX,RX 信号灯无信号传输 显示.按照之前的处理经验重新启动工程师站 AW2001 后恢复正常,为了进一步消除隐患,利用检修 时对 B 路的 SWITCH 进行了更换。 8)2008 年 09 月 02 日 4 号机组 CP4009 下所管辖设备点周期性由蓝底变为正常,CP 自动下 线,报警 FCM A/B 线故障,更换 FCM,硬复位下线 CP 后恢复正常。 9)2009 年 09 月 29 日 3 号机组停机检修 DCS 系统通讯网络冗余切换试验中,负荷 143MW, 通过断开A路光纤交换机电源的方式切断了DCS系统NODEBUS A路网络, 工程师站涉及CP3019, CP3018 的参数出现通讯蓝点,画面切换异常缓慢,操作员站情况类似。恢复 A 路光纤交换机电源, 在 AW3001 工程师站 SYS MGM 中进行 NODEBUS TEST 不能恢复网络,故障现象依然保持,直 到重新启动 AW3001 后,系统恢复正常,整个过程中 CP 工作正常,但是与 AW,WP 站通讯出现 PDF 文件使用 “pdfFactory Pro“ 试用版本创建 www.fineprint.cn 瘫痪。检查过程中发现负责 CP3018 等 CP 的节点总线接入卡 NCNI 的 A/B 路拨码与实际接线不一 致,重新拨码后,再次对 A/B 光纤交换机进行断电,次前的故障不再出现,但是画面切换有比较之 前有比较明显的变慢,其它功能一切正常。所以,基本判断此前冗余试验的失败是由于该对 NCNI 拨码错误所导致。 PDF 文件使用 “pdfFactory Pro“ 试用版本创建 www.fineprint.cn