关键词:轴心轨迹;神经网络;不变性特征矩
摘 要:轴心轨迹的图形形状识别是旋转机械故障诊断中最为重要的内容之一。利用图形的不变性特征矩的识别技术对轴心轨迹的图形数据进行特征提取,并将特征提取结果作为神经网络的输入让其学习,学习完成后,就可利用神经网络对轴心轨迹的图形形状进行分类识别。神经网络采用改进的BP网络,提出的一种确定神经网络最优隐含层节点数的新方法,其正确性得到了大量事实的验证。对仿真轴心轨迹图形形状的识别结果表明,该方法是有效的、可行的。
轴心轨迹的图形形状识别是旋转机械故障诊断中最为重要的内容之一。由于轴心轨迹的各种图形形状可以通过1倍频分量、2倍频分量及3倍频等分量合成,因而神经网络能够有充分的典型样本进行学习,这样,就能够保证神经网络学习到足够的信息,从而对轴心轨迹的图形形状进行有效的识别。
与常规的识别方法相比,用神经网络对轴心轨迹的图形形状进行识别具有以下优点。
(1)神经网络能够处理轴心轨迹的图形数据中含噪声的数据和近似的数据,能从训练样本中自动获取知识,逐步学会适应环境的变化,并能把学到的知识推广到以前未曾处理过的情况。即神经网络具有较强容错能力、自适应能力和自学习能力。
(2)神经网络采用分布式存储信息,具有高度的非线性映射能力,属于并行处理方式,因而对轴心轨迹的图形形状识别具有极高的效率,能够保证故障诊断实时性的要求。
轴心轨迹的图形形状识别实质上是一个二维图形的模式识别问题。对本方法来说,正确选取能够表征轴心轨迹的图形形状的特征参数让神经网络学习,是关键所在。一般,可选取中心矩~或者矩特征M1~M24作为其特征参数,笔者采用前者。
1矩及其不变性
设一个二维模式f(x,y),对于任意正整数m和n,f(x,y)在R2平面上的m+n阶矩定义为:
式中,m,n=0,1,2,…;f(x,y)为图形在R2平面上的分布密度且是分段连续的,在R2平面上的有限部分具有非零值。并且,集合{Mmn}由f(x,y)唯一地确定;反之,f(x,y)也可由集合{Mmn}唯一地确定。
{Mmn}与模式在坐标中的位置有关,不具备平移变换的不变性,但若把f(x,y) 平移到中心,就能够满足平移变换的不变性。故定义m+n阶矩的中心矩为:
为了使{μmn}具有比例变换的不变性,可将其标准化处理:
式中,m+n=2,3,…。为了得到轴心轨迹的旋转变换的不变性,我们利用Hu研究得到的由标准化的2阶和3阶中心矩导出的不变特征集合~:
这7个矩特征构成的矩组对于平移、比例和旋转变换都是不变的量。并且,由m+n阶矩定义可以知道,对于不同的轴心轨迹图形形状,这7个矩特征构成的矩组在数值上是不同的,即某个轴心轨迹图形形状能够确定一组唯一的矩组,反之,一组矩组也能够确定一个唯一的轴心轨迹图形形状。
2神经网络
神经网络是由大量神经元节点组成的并行连接机制的系统,它具有一定的智慧,突出表现为它能够进行学习。神经网络的学习过程主要是按一定的方式来调节神经元节点间的连接权值和节点阀值,从而使网络接近所要求的功能。神经网络的学习算法很多,笔者采用改进了的BP(Back Propagation)算法,它的基本原理是利用梯度下降法来动态的调节网络的权值和节点阀值,从而达到学习的目的。网络采用3层结构。
2.1BP算法的大致步骤
(1)初始化。随机初始化网络权值和节点阀值。
(2)提供训练样本。输入学习样本X0,…,Xn和教师信号T0,…,Tm,以及学习速率η、误差允许值e。
(3)依次计算各层节点输出。
(4)计算训练误差。
(5)修正网络权值和阀值。
(6)判断网络总体误差是否小于误差允许值e,小于则停止,否则转回(3)。
2.2BP算法的改进
BP算法的关键在于对学习速率η的处理,η太大,则会在学习过程中引起振荡;η太小,则使学习速度太慢。因而,较好的办法是在学习过程中根据情况动态改变η值,为此,我们取
2.3最优隐含层节点数的确定
神经网络隐含层节点数L的确定是一个十分重要的环节。如果L太小,则网络根本无法进行学习和识别;如果L太大,则网络的自学习能力很差,无法识别以前未曾见过的模式。只有选择了一个最优的L值,才能够使网络具有较强的鲁棒性、抗噪音能力和自学习能力。一般最优隐含层节点数L可由下面的经验公式确定:
式中,m和n分别为网络的输入和输出节点数;c为介于1~10的常数。由于该经验公式中常数c难以确定,因此,在实际应用中,它很少被使用。
我们在此提出一种较为有效的确定最优隐含层节点数L的经验方法。令整数在经过大量的实验后,发现最佳隐含层节点数L不但与m、n有关外,还与训练样本间的线性相关性及训练样本的数目有关。不过,对于一般的模式识别神经网络系统而言,最优隐含层节点数L一般会落入区间[2,K]或者[K,2K+3](这一点除了见表1中的试验结果外,还可以从文献4中的实验结果数据加以验证)。所以,在确定最优隐含层节点数L时,可以首先从K处取值,然后,可以用“试错法”从k两侧分别取值,比较网络的收敛速度,确定L所在的区间,从而找出最优的L值。表1是在7个输入节点和4个输出节点的条件下用“试错法”得出的。
由表1可见,对于同一个网络而言,最优隐含层节点数L是随着训练样本数目的改变而改变的,但是L的值却大致在区间[2,K]或者[K,2K+3]内变化。因而,对于一般的模式识别神经网络系统来说,在确定最优隐含层节点数L时,本方法不失为一种有效的参考方法。
需要说明的是,最优隐含层节点数的确定涉及很多其他因素(如样本间的线性相关性,样本的复杂性等),是一个复杂的过程,因而目前还没有一种行之有效的方法可以遵循。笔者提出的这种方法,仍然是一种经验公式,在实际应用中还不具备通用性,但只具有参考价值。
3轴心轨迹的识别
我们对“香蕉形”、“椭圆”、“内8”和“外8”4种轴心轨迹进行识别,它们分别对应于神经网络输出端的1、2、3、4节点。神经网络为3层结构,7个输入节点和4个输出节点,隐含层节点数取12。
3.1用神经网络识别轴心轨迹的步骤
(1)对轴心轨迹的图形数据分别按式(6)~(12)计算其不变性矩~。
(2)将计算结果输入到神经网络中去学习。将计算求得的~作为神经网络的输入样本,让其按式(13)~(16)进行学习。由于计算求得的~中有些量太小,为了提高样本间的区分度,以便于网络学习,我们对其进行了一定倍数的扩大。
(3)对待测图形进行分类识别。网络学习过程完成以后,就可以作为分类器进行图形识别了。识别时,先按步骤(1)对待识别轴心轨迹求~,然后将计算结果作为神经网络的输入,让其识别。
3.2轴心轨迹的识别
通过下面的方程式,我们可以获得所需的轴心轨迹图形。并且,考虑到实际的轴心轨迹的数据中常混有噪音,为此,我们在生成轴心轨迹图形时,也人为地加入了一些噪音。
式中,w为角频率,A1,A2,A3和B1,B2,B3分别为X(t)和Y(t)的1、2、3倍频分量;α1,α2,α3和β1,β2,β3分别为相应的初始相位。通过改变这12个参数,可以获得我们所需的轴心轨迹图形。
本文所用的轴心轨迹样本图形及待识别图形有香蕉形,椭圆形,内8字形,外8字形(图形略)。表2中为10种待识别图形的识别结果。
表2中的数据为各次识别过程中神经网络的4个输出端的输出结果,是无量纲的。某次识别过程中某个输出端的数值最大,则该次识别结果即为该端口所代表的图形。以(a)组为例,该组中第1个端口的数值最大,所以该次识别结果为端口1所代表的图形。由于端口1所代表的图形是“香蕉形”,所以最后的识别结果是“香蕉形”。由表2可见,识别正确率为100%。当待识图形的形状与样本接近时,识别结果的置信度较大,当待识图形数据中的噪音增加时,置信度随之下降。不过,总的来说,识别结果还是令人满意的,特别对椭圆和香蕉形,椭圆和内8这两组相似程度较大的图形,神经网络表现出了良好的识别能力。神经网络的这种较强的鲁棒性,是其广泛应用于模式识别的重要原因之一。
4问题讨论
(1)在计算~的过程中,由于某些项数值很小,为了便于网络学习和识别,将其乘以一个适当的系数。事实表明,合理的选择系数,能够更加有效的提高样本间的区分度。选择系数的原则是,尽量减小样本数据在数量级上的差距,对~中的较小项进行放大,使这7个数值尽量在同一个数量级范围内。
(2)本文在产生轴心轨迹的各种典型形状时,只包含了1、2、3倍频分量,而实际的轴心轨迹的图形数据中的主要成分除了这3种分量以外,还包括一些其他成分,如分倍频等。因此,在实际应用时,可根据情况,在合成轴心轨迹的各种典型形状时加入一些其他分量。
(3)神经网络具有较强的容错能力,当轴心轨迹的图形数据中混有少量的噪音时,并不影响识别结果,当噪音较重时,就会严重影响识别结果,为此,可以先对实际数据进行滤波处理,然后再交由神经网络识别。
5结语
由于~具有平移、比例和旋转不变性,能够表征轴心轨迹的图形形状的特征参数,且数据项较少,因而特别适合于神经网络的构建和学习,能够充分发挥其较强容错能力、自适应能力、自学习能力及并行处理能力等优点。笔者利用神经网络对4类较为典型的轴心轨迹的图形形状进行了仿真识别,结果表明,该方法是有效的、可行的。