对于电站基本控制设备的调速器来说,可靠性是首要的问题。故障现象是一个概率问题,满足一定的概率分布律。在可靠性理论中有一系列可靠性指标。但是,工程上最有实用价值的是下列两个指标。
(一)平均故障间隔时间MIBE
它是故障发生间隔时间的数学期望值。有时也采用平均首次无故障时间MTIFF(Mean Time To First Failure)。
(二)平均可利用率
可靠性技术主要包含故障诊断及故障处理两个方面,下面分别加以叙述。
二、故障诊断技术
(一)故障诊断分类
故障诊断一般可分为如下两类。
1.自诊断
凡是具有CPU的单元或模块对其所辖部分进行的诊断称为自诊断。它又分为如下两种。
一是离线自诊断。微机调速器在合上电源后,应对其硬件及软件进行一次比较过细的检查与诊断。只有在设备完好时,才允许投入运行。这是保证设备健康上岗而不带病上岗的重要措施。如有故障,则应显示故障的类别及其发生的部位(即故障定位),这样可大大缩短检修的时间。由于上电自诊断是在调速器投入运行前进行的,所以有较充足的时间,可设置较多的诊断项目。此外,在双机系统中,当一个模块有常驻故障时,一方面切换至另一模块;另一方面,也进行本项诊断,以便于维修(见图2一3一8(a))
二是实时自诊断。在实时运行过程中,为了提高可靠性,应对硬件及软件的故障进行诊断。但是,在有限的控制周期中(例如20一50ms),能够用于故障诊断的时间资源很少,因而必须采用分时循环诊断法,即在每个控制周期中,只诊断一部分项目,而每隔若干个周期对所规定的项目全部诊断一遍。
2.互诊断
在多CPU系统(含双微机及多微机调速器)中,各CPU还可借助通信所获得的信息相互进行诊断。这是多微机系统重要的优点。在双机系统的互诊断中,要正确处理好争议问题。
我国开发的微机调速器在不同程度上实现了上述几种诊断。
(二)故障诊断内容
1 . RAM的论断
RAM的故障主要有:①某一位恒接地;②某一位恒接高电位;③一个字节相邻位之间相互短路;④相邻字节(或字)的相邻位之间相互短路。可用写读十六进制码AAAAH与5555H的方法进行校验。
2. ROM的诊断
ROM区是存放程序和数据库的场所,其内容的改变不但会使数据出错,而且可能使程序乱套,后果严重。其检错方法很多,最简单的方法是分区累加ROM的内容。如与固有结果相符,则正确;否则,有故障存在。
3 .CPU的诊断
对CPU诊断的基本方法是设计一个微诊断程序,巧妙地将各种操作及全部内部寄存器有机地组织成一个整体。在一定的输入条件下,只能获得唯一的结果。在诊断中,执行此微诊断程序,如获得预想的结果,则CPU正常;否则,则有故障。
4.软件的诊断
软件的可靠性有两重含义:第一,指固有的故障,这些应该在调试过程中解决;第二,指使用过程中产生的故障。这里主要指的是第二种,可用下列方法诊断。①同样的软件运行2次或以上,如它们的结果一致,则正常;否则,不正常。②为同一功能设置两种(或)以上不同的版本,如它们的运行结果一致,则正常;否则,不正常。上述两方法的代价是消耗时间资源。③在多微机系统中,若干个CPU执行同样的软件,如它们的结果一致,则正常;否则,不正常。用这种办法的代价是要消耗设备资源。采用何种方法,需经技术经济比较确定。
5.测频、输入/输出接口等硬件部分诊断。
6.液压随动系统诊断。
7.电源的诊断。
8.故障性质的诊断
故障性质诊断的目的是针对不同的故障采取不同的处理办法。从故障严重的程度看,可分为致命故障与非致命故障。例如,频率信号消失、CPU损坏等属致命故障。对于这类故障,在双微机调速器中需双机切换,或切至手动。而对非致命故障,则只需发出警报。从故障存在的时间考察,可分为常驻故障与瞬时故障,前者不经人为干预不会自动消失,而后者由随机干扰引起,只短暂存在。可用以下的方法区别上述两种故障:如某个故障存在的时间短于预定的时间,则为瞬时故障;否则为常驻故障。在故障处理技术一节中,对于这两种故障,将采取不伺的处理办法。
三、故障处理技术
故障诊断解决了下列问题:是否有故障存在?属于何种性质?故障发生在何处?但是,只停留在这一步还不够,更重要的是对症下药,对故障进行处理。这是提高可靠性更关键的一着。故障处理主要有下列方法。
(一)容错技术
容错技术中最常用的是冗余技术。前面介绍的双机系统及其相应的切换策略、三机系统及其投票表决均属于容错技术。这种思想可应用于整个系统及其各个部分。
就硬件而言,冗余技术可应用于子系统、部件、元器件等,如传感器、I/0接口、电源。对于三峡工程这样的巨型机组,为确保可靠性,乃至电液转换器也应该冗余。在1999年7月及2000年3月三峡工程机组调速器的技术交流及投标中,ABB ALSTOM POWERWOODWORD,VA TECH等国际著名调速器公司都提出了冗余电液转换器的方案。
就软件而言,在软件故障诊断中提到的两版本及多版本法也是冗余技术。
(二)避错技术
该技术的目的是:当有错误或故障存在时,不让其对结默生影响。避错技术是一种软件手段,一般包含两个步骤。
第一步:鉴别测量值或运算结果(含中间结果及最终结果)正常与否,或程序流运行是否正常。
第二步:若不正常,丢弃错误结果,按一定规则选取合理值,从而达到避错的目的。
根据不同情况,可分别采取下列措施。
1.增量鉴别法
许多物理量的增量是有界的。例如,两相邻采样周期间机频增量受下列条件约束:
在测频中,如测得超过上述极限的频率,则将其丢弃,而认为本采样周期的频率与前
用上述规则可排除测频的随机干扰。
对其他物理量,也可采用类似的方法处理。
2.全量鉴别法
在调速器中,许多物理量(如接力器行程、频率、功率等)都有其相应的上下界。如果在测量或运算中出现越界的值,显然是错误的。下面以频率为例说明之。
3.函数鉴别法
一般来说,每个函数(包括三角函数、双曲函数,以及自定义的函数等),都有一定的界限。例如,正弦函数的取值范围为一1至+1。凡超限者,均为错误值,丢弃之。
4.程序流鉴别法
在程序运行受到干扰时,可能产生的程序流错误主要有两种:第一,飞跳;第二,死环。
为检验飞跳,事先可将程序分成若干段(例如,m段),且设一软件计数器,每执行一段加1。在程序出口处,检查软件计数器内容,如与预定数m相符,则正常;否则,不正常,丢弃其运算结果。
为避免死环,最常用的方法是在循环中设置Watchdog。在死环情况下,将在预定的时间内执行硬件复位,跳出死环。在无Watchdog功能的微机中,可以模拟上述思想,设置‘软件Watchdog",实现软件复位,或采取其他避错处理。
(三)纠错技术
纠错技术范围很广,这里只介绍一种方法。修改或整定参数是微机调速器中经常要遇到的。例如,功率给定·频率给定·开度限制·kp, ki, kd, bp。等。在输入参数时,要防止的错误有两种,一是输入了错误数据,二是误将过渡数据作为最终结果。为此,可设置一缓冲区和一有效键。实施步骤如下。
第一步,输人数据暂存在缓冲区。
第二步,按有效键,此时检查所输入的数据是否在正常范围内。若是,则将缓冲区中的数据传送至相应的地址;否则,不接受新数据,而保留原有值,或取常用值。
(四)结构重组和参数重配技术
结构重组技术是指在系统发生故障时,通过对控制系统结构的重新构筑和对其参数的重新配置,达到确保安全、故障弱化的目的。参数重配则往往不改变控制系统结构,而只对参数进行重新配置。上述方法如果运用得巧妙,不但可确保可靠性,甚至可以使系统保持故障前的性能。自然,针对不同的故障,需要采取不同的结构重组和参数重配技术。
现以接力器反馈断线故障为例对结构重组技术进行说明。图2-3一14给出了增量PID调节的简单框图。在正常情况下(即接力器反馈完好),液压部分为一随动系统。当接力器反馈断线时,由于接力器是一积分环节,任何微小的正向输入都将使接力器向开机侧运动,直至全开。显然,这是不允许的。
处理该故障最简单的办法是:使接力器保持原位不动。这是目前最通用的方法,且不难实现。但是,这种方法的致命缺点是:它完全丧失了调节能力。如果此时甩负荷,将使机组转速急剧升高,产生飞逸,因而,如采用这种方法,必须附有防飞逸措施。
采用结构重组的方法是:当检测到接力器反馈断线时,图2一3一14的软件开关S由上位’切至下位。不难看出,原控制回路中由△U7(k)变为U(k)通过了一个数字积分环节1 /( 1一q一-1‘)。软件开关切换至下位’后,数字积分环节被切除了,积分的功能由接力器完成。由于接力器时间常数T、与控制周期二不一,为使接力器输出与反馈断线前一致,加入了一个〔Ty./τ」环节。这可视作参数重配。进行上述处理后,系统闭环传递函数不变。这种处理方法的优点是:在接力器反馈断线时,调速器照样能进行正常调节,
而且其性能与断线前几乎完全一样。这种结构重组方法在模拟综合和数字综合中均能实现。