国华准格尔发电有限公司(以下简称准电)3期扩建工程2×330MW机组分散控制系统(DCS)采用西门子公司的TXP一3000分散控制系统。该系统是西门子公司原TXP系统的替代产品,在国华准电的应用属国内首次。
1、系统配置与分析
1.1网络配置
(1)电厂总线担负DCS各子系统问(AS、OM、ES)的通信任务.为工业以太网.遵循ISO/OSI的7层结构建立起来的国际标准通信协议。
(2)总线系统包括电厂总线和终端总线,均为通过光缆建立的局域以太网,采用标准的TCP/IP协议,传输速率为100Mbit/s。
(3)总线系统由若干个OSM模件组成。OSM模件为光缆总线接口总站,带有自己的电源。通过OSM模件,DCS系统的各成员以星型结构连接在一起。总线系统为虚拟环网,设若干OSM模件,OSM模件设1组电子开关。
1.2控制器(CPU)配置
西门子T-3000分散控制系统现场级控制器采用西门子S417控制器。按系统划分并兼顾DCS功能分布配置,实行硬件物理分散布置、信息集中管理的设计原则。所有处理器模件均冗余配置,一旦某个工作的处理器模件发生故障,系统能自动无扰快速切换至与其冗余的处理器模件,并在操作员站报警。冗余配置的处理器模件与系统设并行的接口,均能接受系统对其进行的组态和组态修改。处于后备状态的处理器模件能不断更新自身获得的信息,并保持与工作模件数据同步。
准电单元机组CPU处理器配置为锅炉8对、汽机4对、电气2对;公用CPU处理器配置为电气公用系统及热控公用l对、循环水泵房公用2对。
1.3I/0卡件类型
I/O卡件类型如表1所示。
1.4机柜配置
西门子T-3000分散控制系统机柜按功能配置.包括控制柜和10机柜。控制柜内正面安装控制器CPU和各类卡件,背面安装FIM端子接线板;IO由于DCS模件工作电压为24VDC,而控制对象的驱动电压为220VAC,故DCS的控制驱动信号经继电器柜输出。
1.5人机接口配置
用于过程监视的人机接口站每台机组包括操作员站4套、工程师站1套、历史数据站1套、大屏幕操作站2套。ES工程师站为1个数据库支持的全图形系统,采用了统一的现代化图形系统和用户接口,使控制系统的操作快速、安全、方便。ES工程师站可为所有子系统组态。包括总线系统。该工程师站为图形界面,无需编程语言,可以自动生成代码及自动下载代码,可进行系统故障跟踪分析;但事故追忆功能操作繁琐。
1.6电源及接地
单元机组DCS设3个DCS电源柜,DCS电源一路来自电气UPS220VAC,另一路来自保安段220VAC。DCS公用系统设1个公用DCS电源柜,两路电源进线分别来自3号、4号单元机组DCS电源柜。远程数据采集系统电源由单元机组DCS电源柜供给。
DCS系统不单独设置接地网。集控室电子间内DCS各机柜设备按照布置位置分组分别接地至设置于电缆夹层的总接地箱,再由总接地箱统一接至就近电厂接地网。
1.7服务器ftServer
西门子T-3000服务器,采用的是ftServerW系列4300系统,为不允许发生故障的应用专用服务器。ftServer4300系统不仅提供99.999%的运行时间,而且配备Intel⑧XeonTM处理器,在2路对称多处理(SMP)服务器上提供高性能处理能力。系统特性如下:处理器Intel⑧XeonTM,3.2GHz,内存4GbytesDDR,存储子系统SCSI驱动器支持74Gbytes。在服务器ftServer上运行SPPAT-3000MonitorService[Start]~启动了控制系统服务器,相关项目容器、报警容器、通信协议等随即启动。
2、系统存在的问题及解决方法
由于该DCS系统在国内是首次应用,对该系统的了解还不够深入,DCS从到达现场开始就频频发生各类问题,DCS系统死机就发生了10余次。以下针对其中比较突出的问题进行分析。
2.1调试期间系统死机原因分析及处理
2.1.1第1次死机
现象
死机具体表现为从工程师站查找不到公用系统的控制器,操作员站无法对公用系统进行监视和操作。即DCS系统失去公用系统的功能。经分析,原因是由于IP地址配置冲突,即公用系统与3号机组IP地址冲突,导致系统无法识别公用系统服务器,从而失去对公用系统的通信与控制。
解决办法
重新设定系统各服务器的IP地址。处理后系统运行效果良好,此类故障再未发生。
2,1.2第2次死机
2,1.2.1现象
第2次系统死机现象与第1次相同。经分析,原因为系统组态下装功能开放性过强,即此系统任意1台计算机均可进入在线组态方式,并能够同时对同1个AP的同1个逻辑进行在线组态下装,多用户同时通过3号机组授权用户修改公用系统组态,造成系统故障。
解决办法
加强系统在线组态下装的管理,严禁多用户同时对同1个AP的同1个逻辑进行在线组态下装。该解决办法为暂时性解决方法.根本的解决方式应从系统内部设定,限制多用户同时对同1个AP的同一个逻辑进行在线组态下装,1个用户进入1个AP组态时另1个用户无法再进入该AP进行在线组态。该方案已经提供给西门子公司,建议其对T一3000系统进行修改和优化。
2.1.3第3次死机
现象
第3次公用系统服务器死机现象与前2次相同,排除了上述原因后,结束服务器内相关进程重新启动服务器后正常。所以认为死机原因为相关进程内部数据设置错误,不能满足现场正常运行条件.相关服务器进程发生数据溢出,最终导致服务器运算速度变慢并死机。根据分析。最终经西门子公司远程登录系统检查。发现服务器alarmcontainer(AC)进程设置容量为128Mbytes,而调试过程中报警点比较多,容量为145Mbytes,已经超过128Mbytes。
解决方法
按照德国西门子建议将AC进程容量修改为256Mbytes。但本次修改未能根本解决系统死机的问题。
2.1.4第4次死机
现象
第4次DCS系统再次发生通信故障,故障现象为机组各个AP不定时发生通信故障,故障过程时间不等,一般为2~10S,最长时间为4rain,之后系统恢复正常。在故障期间,DCS系统失去对现场设备的监视和操作功能,并且不能保证保护联锁的正确动作。经过现场分析,造成的原因仍是内部设定问题,发现服务器CC进程容量为128Mbytes(容量不足),造成服务器运算速度变慢。
解决方法
按照德国西门子建议将CC进程容量修改为256Mbytes。但本次修改未能彻底解决系统死机问题。
2.1.5第5次死机
现象
第5次系统死机现象为DCS10一l机柜AB、AC两排卡件中所有DI卡件系统认为未安装,导致该机柜控制的现场设备失去控制,即定子冷却水泵和C给水泵油泵发生自启停现象。经过分析,可能是更换该机柜内卡件未复位造成的,也有可能为该AP外供电方式模拟量信号大范围跳动导致AP运算变慢造成的。
解决方法
对机柜内更换任意卡件时均进行复位处理后,该问题再未发生。
2.1.6第6次死机
现象
第6次系统发生严重死机,现象为系统报警窗故障,且画面切换迟缓,画面显示点均为坏点,操作员画面无法对设备监视操控。当时的处理方法在服务器上重启AC进程后系统恢复正常。几天后DCS再次发生严重的死机事故,所有操作员站和工程师站全部失去功能。经过观察,当时系统服务器个别进程超出其被分配的动态内存空间,由于这些进程的溢出导致服务器CPU负荷率大幅度上升,系统处理数据的过程变得极其缓慢,最终导致系统瘫痪。经重新启动服务器后,系统恢复正常,但未能从根本上解决该问题。
解决方法
经过以上2次事故.现场决定暂时停止机组试运。针对以上问题,根据以往调试经验,提出了如下解决方法:
(1)对外供电模拟量输入信号增加隔离器,保证信号的稳定性,大幅度减少由于模拟量信号剧烈波动造成对系统资源的占用;
(2)改变部分信号、逻辑系统采样时间和分辨率,减少系统负荷;
(3)限制操作员站和工程师站同时打开画面的数量,减少系统负荷;
(4)对系统报警点进行整理,删除无用的报警点,优化报警复位功能,减少系统负荷。
实施以上各项措施后,各个进程占用容量大幅度减少,如AC进程由最高的312Mbytes减少到120Mbytes左右。根据德国西门子的意见又对系统内5个进程的容量进行了扩充,随后对机组进行了点火启动,DCS未再发生严重的死机、系统通信阻塞中断等现象,并顺利完成吹管。寄存器参数调整为:AC、CC为384Mbytes(原始默认值为128Mbytes),ARC196Mbytes(原始默认值为64Mbytes),RC128Mbytes(原始默认值为64Mbytes),PDS256Mbytes(原始默认值为128Mbytes)。
德国西门子总部T-3000开发组对国华准电现场数据进行分析研究,并针对本工程对系统提出的要求,专门编写了系统软件升级包,对3‘号、4号机组DCS进行了软件升级,升级后直到2台机组168h结束,该系统再未发生系统软件死机事故。
2.2调试期间系统其他故障原因分析以及处理
2.2.13号、4号机组DCS系统功能块设计错误
发现3号机组在冲车阶段DCS系统部分自动控制系统的PID调节器工作不正常,调节器在DCS内部被集成为CCTRL功能块。该功能块具备PID计算以及操作器的功能。该问题具体表现为:投入自动后一段时间,发生调节器输出大幅度变动状况,变动范围为0~100%,如图1所示。图中黑色部分为PID输入偏差,该数据几乎不变;蓝色为PID调节器输出.瞬间突增至100%;红色为执行机构反馈跟随PID指令。以上现象主要发生在轴封的3套自动中。随后对这3套自动逻辑进行了检查,根据历史趋势,发现以上现象发生时PID调节器输入偏差几乎不变.且自动控制原理十分简单,没有微分以及前馈等作用,从控制原理来讲不应发生以上现象,所以判断为该PID功能块设计存在问题。
通知南京西门子现场服务人员进行处理,最终确认由于PID调节器微分环节设计有问题导致输出突跳。之后德国西门子对该功能块进行了在线升级。升级后该问题再未发生。
2.2.2DCS系统DI通道的问题
在调试过程中发现每个开关量输入通道(DI)都配有1个0.2A的玻璃管保险,在机组运行过程中如果保险损坏且不能被及时发现,重要的保护联锁信号将不能传递到DCS,造成保护拒动,给机组设备带来灾难性的后果。发现这个安全隐患后,调试人员将2台机组共400余块DI卡件FIM卡进行了更换,对所有DI卡件通道重新进行了传动。该卡件需要进行经常性巡视,观察卡件内保险报警显示灯,一经发现有损坏,立即进行更换,保证机组在运行过程中不发生保护拒动。
2.2.3模拟量信号隔离问题及处理
在调试中发现,外供电模拟量输入信号与DCS的AI卡件不匹配,使得测量信号在大范围内突跳,无法使用,且严重影响该信号所在机柜内CPU的运算速度,导致系统运算速度变慢,机柜内其他正常信号采集不到,导致DCS系统机柜内CPU死机,失去对就地设备的控制,使就地设备发生自启停现象。该问题还大量占用系统资源,DCS系统AC等进程占用容量急剧增加,导致系统死机不可用。依据以往调试经验,在DCS系统AI卡件输入侧加入了信号隔离器,2台机组共增加双通道隔离器322个.彻底消除了该缺陷。
3、调试效果
在准电调试过程中,通过对西门子公司新研制的DCS系统的优化,实现了机组168h结束时,热控系统各项指标均达到优良,DCS系统能完全适应现场应用要求。实现了2台机组168h结束后连续稳定运行100d以上。
(转载)