广告招募

当前位置:全球装备网 > 技术中心 > 所有分类

DCS系统工作站时钟混乱引发DCS系统失灵案例

2025年02月10日 13:45:06      来源:云南昌晖仪表制造有限公司 >> 进入该公司展台      阅读量:41

分享:

昌晖仪表通过工作站时钟混乱引发DCS系统失灵的故障处理案例,分享仪表工处理NTP报警故障的思路和方法。

背景

某电厂2号机组负荷200MW,#1至#9控制器处于控制方式,#51至#59控制器处于备用方式。8时23分,各控制器依次发NTP报警,历史站报警窗口显示如下:
Aug 3 08:23:50 drop7<7>NTP:too many recvbufs allocated(30)
Aug 3 08:23:50 drop4 <7>NTP:too many recvbufs allocated(30)
……(注:NTP为网络时间协议;Network Time Protocol用来同步网络中各个计算机的时间的协议。)
8:26,#2控制器脱网,#52控制器切为主控;
11:05,#52控制器脱网;
13:39,#7控制器脱网,#57控制器切为主控,在#7控制器向#57控制器切换瞬间,由该控制器控制的A、B磨煤机跳阐;
15:11,#9控制器脱网,#59控制器切为主控,在#9控制器向#59控制器切换瞬间,由该控制器控制的E磨煤机跳阐;
15:51,#1控制器脱网,#51控制器切为主控,在#1控制器向#51控制器切换瞬间,由该控制器控制的A引风机动叶被强制关闭。
15:22,重启操作员站drop213(备用时钟站),NTP报警未消失;
15:35,重启历史站,NTP报警未消失
15:59,重启工程师站(主时钟站),NTP报警基本消失;
16:09,重启历史站;
16:30,系统恢复正常。

故障原因分析

1、NTP软件的作用就是维持网络时钟的统一,主时钟设置在工程师站上,备用时钟设置在操作员站上。控制器脱网原因为主时钟与备用时钟不同步造成系统时钟紊乱,从而造成NTP报警导致控制器脱网。

2、NTP故障的原因有两种可能,一种是主频为400MHz工作站,不同于1号机组的270MHz(SUN公司在400MHz工作站上对操作系统有较大改进)工作站,2号机组所用的1.1版本软件在400MHz工作站上未测试过,不能确保1.1版本软件在此配置上不出问题。另一种是主时钟与备用时钟不同步,在8月3日控制器脱网后,曾发现Drop214的时钟比其它站快了2秒,当时Drop214的画面调用速度较慢,经重启后正常,并且NTP时钟报警是在系统运行73-75天左右才出现的,估计是系统时钟偏差积累到一定程度后导致主、 备时钟不同步,而引起系统时钟紊乱,最终导致控制器脱网。

3、NTP时钟故障使控制器脱网,处理不及时会使报警的控制器依次脱网,从而导致整个控制系统瘫痪。

防范措施

1、根据本次故障现象,制造商将软件1.1版本升级为1.2版本。
2、为确保控制系统可靠运行,定期重启主时钟和备用时钟站。
电厂5号机组在试运期间曾发生DCS时钟与GPS时钟不同步,引发DCS操作员失灵事件。由于网上传送的数据均带时间标签,时钟紊乱后会给运行机组带来严重后果,基本情况与2号机组类似。采取的措施是暂时断开GPS时钟,待软件升级和问题得到根本解决后,再恢复GPS时钟。

版权与免责声明:
1.凡本网注明"来源:全球装备网"的所有作品,版权均属于全球装备网,转载请必须注明全球装备网。违反者本网将追究相关法律责任。
2.企业发布的公司新闻、技术文章、资料下载等内容,如涉及侵权、违规遭投诉的,一律由发布企业自行承担责任,本网有权删除内容并追溯责任。
3.本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。 4.如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系。