楊帆(1973—)
男,陜西禮泉人,講師,碩士,主要研究領域為智能信息處理技術、計算機監控技術。
基金項目:陜西科技大學自然科學基金資助(ZX05-37);陜西省工業攻關項目(2006K05-G18)
摘要:針對減速箱運行狀態和特征參數之間存在的復雜非線性關系,提出了基于主成分分析的RBF神經網絡減速箱運行狀態診斷方法。該方法用主成分分析方法將高維相關特征參數轉化為低維相互獨立的特征參數,在此基礎上建立了RBF網絡分類器,并用該網絡對某汽輪機減速箱的運行狀態進行識別。理論分析和實驗結果表明,基于PCA和RBF網絡方法的減速箱運行狀態診斷技術具有模型簡單,檢測速度快等優點,可以在實際應用中發揮有效作用。
關鍵詞:主成分分析;RBF網絡;特征提取;狀態診斷
Key Words: PCA;RBF network;Characteristics extraction;Status Diagnosis
減速箱是各類機械傳動部分的關鍵部件。根據研究和統計分析表明,減速箱內各零件失效比最大,約占機械傳動系統故障的 60%。因此進行狀態監測和故障診斷,識別設備的工作狀態,及時發現異常情況,對故障進行早期診斷和預報,從而有針對性、有計劃性地采取檢修措施,確保設備安全運行就顯得非常重要。
在機械故障診斷中一般描述系統采用的參數越多,被認為對系統的認識越深刻。但是如果利用過多的系統參數作為診斷識別系統的數據,一方面由于參數之間不可避免的相關性以及量測過程中噪聲的引入,就會使得常用的診斷算法性能下降;另外一方面,引入的參數越多,就會占用大量的機器處理時間和存貯空間,影響診斷的速度。所以在診斷過程中提取核心特征參數、抑制噪聲數據是簡化計算過程,提高診斷識別率的重要步驟。本文采用了主成分分析( PCA) 方法進行特征再提取,通過創建一個替換的、較小的變量集來“組合”原始特征的精華,原始數據可以投影到該較小的集合中。在PCA特征提取的基礎上,用RBF神經網絡分類器進行了某汽輪機減速箱的運行狀態診斷,取得了較好的診斷結果。
1 PCA方法基本原理
成分分析是用來在數據中尋找恰當的特征表示的方法。主成分分析(principle component analysis)PCA一般用來對輸入樣本集進行預處理,可把多個存在復雜非線性關系的特征參數轉化為較少的彼此不相關的綜合變量,接著以這些較少的向量形成新的網絡輸入變量,從而降低神經網絡輸入的變量數,優化網絡結構。PCA的對象是過程變量的樣本數據矩陣。數據矩陣的行表示采樣值或觀察值,列表示變量。PCA產生一個壓縮的統計模型——主元模型,模型給出了變量的線性組合,描述了數據變化的主要趨勢。主元模型使原標準差的平方重新分布,大多數標準差平方會分布在第一主元上,其次分布在第二主元上,依此類推。按某種準則將最后幾個主元視為分解殘差予以忽略,則有可能利用最少主元來說明最多的信息。主元模型舍棄了部分殘差而保留體現數據變異的主要方向,從而達到抽取系統信息,清除系統干擾的目的。
實際應用中,合理確定主元個數進而建立主元模型非常重要。通常采用方差累積貢獻率百分比(CPV)原則,選擇百分比大于85%的主元個數。在基于PCA的過程狀態、故障的診斷中,一般用來描述正常運行過程的主元不超過3個(Kresta等,1991)。主成分分析的主要計算步驟如下:
(1) 原始樣本標準化
為了消除量綱和數量級不同的影響,采用均值標準差標準化方法處理原始樣本數據。
(2) 建立標準化變量的協方差矩陣,求解矩陣的特征值和特征向量
利用標準化值計算變量之間的相關系數,有k個特征參數可建立k階相關矩陣。由此矩陣可獲得由大到小排列的特征值Ai(i=1,2,L,k),k個特征值對應k個特征向量,每一特征向量包含k個分量。
(3) 根據要求的累計貢獻率, 選取主成分
計算第i個主成分對總方差的貢獻率,即方差貢獻率:

(4) 建立主成分方程、計算各主成分值
各主成分值方程為:

2 基于PCA的RBF網絡診斷方法
2.1 RBF神經網絡結構
神經網絡對復雜問題具有自適應和自學習能力,為解決復雜系統的信息處理和控制等問題提供了新的思想和方法。作為一種前饋型神經網絡,RBF網絡避免了BP神經網絡的冗長繁瑣計算,學習速度較通常的BP方法快的多,具有良好的泛化能力,能以任意精度逼近非線性函數。RBF神經網絡一般組成結構如圖1所示:
圖1 RBF神經網絡結構圖

其中x是n維輸入向量;Ci是第i個基函數的中心,與x具有相同維數的向量,




從RBF網絡結構可以看出,輸入層實現從



RBF 神經網絡的學習過程主要分為兩個階段。首先,根據輸入樣本求出各隱層節點高斯核函數的中心ci和每個中心的半徑Ri。隱層參數確定以后, 還需要求出隱層和輸出層之間的權值wik。
2.2 基于PCA的RBF網絡診斷模型
基于PCA和RBF神經網絡的減速箱運行狀態診斷系統實現框圖如圖2所示。
圖2 基于PCA和RBF神經網絡的減速箱運行狀態診斷系統實現框圖
(1)獲取描述某汽輪機減速箱運行特征參數以及運行狀態分類決策結果,形成原始數據集。
(2)基于PCA方法抽取訓練數據集的主成分;
(3)構造基于主成分的訓練數據集;
(4)基于主成分訓練數據集構造并訓練RBF神經網絡模式分類器;
(5)將新的觀測向量(與原始數據維數相同)變換到主成分空間,得到主成分空間的觀測對象變量。
在主成分的訓練數據集上基于訓練好的RBF神經網絡進行推理分類。
3 實驗過程以及結果分析
為了驗證本文提出方法的正確性和有效性,選取一組實際采集的某汽輪機減速箱運行實驗數據(表1) 進行運算驗證。
表1 汽輪機減速箱運行狀態特征數據:
表1中共有100組實測減速箱運行數據,a1~a8為采集到的8個特征參數,表中狀態值1表示正常,2表示故障。將樣本數據分為2組,選前80個數據進行訓練網絡,后20個數據進行檢驗。為了消除由于數據量綱對于最后判決帶來的誤差,首先進行歸一化處理,然后進行主成分分析,計算得到主成分的方差累計貢獻率為:76.2117、86.0981、93.3289、98.1578、 99.3166、99.8645、99.9573、100.0000,按照方差累計貢獻率>90%獲取主成分,最終生成3個主成分x1,x2,x3,其計算方法如下所示。
u1=(-0.3986 -0.3657 -0.3570 -0.3944 -0.3307 -0.3760 -0.2335 -0.3452)’;
u2=(0.0189 -0.3638 -0.3765 -0.07312 -0.0469 0.0691 0.8024 0.2633 )’;
u3=(-0.1959 0.2471 0.3770 0.1793 0.0052 -0.4213 0.5197 -0.5279)’;
使U=(u1 u2 u3)’,與標準化處理后得到的數據集X按照式計算,即可得到原始數據的主要成分表示,如表2所示。
表2 主成分訓練數據集:
利用主成分訓練數據集的前80個數據進行RBF網絡的構造和訓練,后20個作為測試數據,試驗結果表明:基于PCA和RBF神經網絡的減速箱運行狀態診斷方法的診斷結果與實際完全一致。可見,基于PCA方法將觀測向量投影到低維空間,構造出相互獨立的主成分觀測向量后,可以簡化RBF神經網絡的結構和計算,對于提高診斷速度的目標作用十分明顯。
4 結束語
在減速器狀態監測和故障診斷中,將主成分分析與RBF神經網絡技術相結合,通過對原始特征參數的降維處理,得到互不相關低維主成分空間特征參數,以此為RBF神經網絡的輸入向量,進行網絡的構造和訓練,最后利用訓練好的網絡進行減速箱的運行狀態診斷。相比傳統的單純神經網絡狀態診斷方法,本文提出的診斷方法由于PCA技術的引入,減少了輸入向量的維度,消除了相關信息和噪聲數據的影響,簡化了神經網絡的結構,提高了分析運算的速度,可以在減速箱運行狀態的實時診斷中發揮有效作用。
其它作者:
張玉杰(1967-),男,陜西武功人,副教授,碩士,主要從事嵌入式智能系統研究;
張彩麗(1973-),女,陜西合陽人,碩士,主要從事機電系統故障診斷技術研究。
參考文獻
[1]范金城. 數據分析[M]. 北京:科學出版社,2002 141~153.
[2]梁循. 數據挖掘算法與應用[M]. 北京:北京大學出版社,2006 184~187.
[3]任若恩. 多元統計數據分析[M]. 北京:國防工業出版社,1997 92~109.
[4]熊和金. 智能信息處理[M]. 北京:國防工業出版社,2006 123~135.
[5]殷勤業. 模式識別與神經網絡[M]. 北京:機械工業出版社,1992 98~104.
[6]曹龍漢. 柴油機智能化故障診斷技術[M]. 北京:國防工業出版社,2005 131~135.
[7] Luo, Rongfu; Misra, Manish; Himmelblau, David M. Sensor fault detection via multiscale analysis and dynamic PCA Industrial and Engineering Chemistry Research, v 38, n 4, Apr, 1999, p 1489-1495.
[8] Abdel-Qader, Ikhlas, PCA-Based algorithm for unsupervised bridge crack detection,Advances in Engineering Software, v 37, n 12, December, 2006, p 771-778.