邵聯合(1974-)男,黑龍江虎林人,工學碩士,大學講師,現就職于保定電力職業技術學院,主要研究方向為生產過程自動化及儀器儀表。
摘要:軟測量技術是解決現代復雜工業過程中較難甚至無法由硬件在線測量參數的實時估計問題的有效手段。本文介紹了基于回歸支持向量機(SVR)算法的基本原理,并以非線性、時變、大滯后的PTA氧化過程為研究對象,使用SVR算法對4-CBA含量進行了預測。結果表明,與傳統預測方法相比,采用SVR算法的預測模型,具有精確度高,泛化能力強等優點,是用于PTA氧化過程中4-CBA含量預測的一種有效的方法,具有很好的應用價值。
關鍵詞:軟測量;數學模型;4-CBA;回歸支持向量機
Abstract: In the modern complex industrial processes, some variables are very hard to be measured or even cannot be measured on-line by existing instruments and sensors. Soft-sensing technology can effectively solve the problem of realtime estimation. The basic principle of Support Vector Regression Machine (SVR) algorithm was introduced in this paper. For the process of PTA oxidation with non-linear, time-varying, large time delay characteristics, the 4-CBA Content was predicted by SVR. The predicted result was compared with that of traditional forecasting methods. The comparison result shows that the SVR has better integrative performance, high precision and generalization ability,so it is an effective method for being used in forecasting of 4-CBA content of PTA oxidation process and has a very good application value.
Key words: Soft-sensing; Mathematical model; 4-CBA; Support Vector Regression Machine
1 引言
建立在統計學習理論基礎上的支持向量機 (support vector machine,SVM)[1-3]已成為當前機器學習領域的一個研究熱點。
支持向量機采用結構風險最小化準則,在有限樣本情況下,得到現有信息下的最優解而不僅僅是樣本數趨于無窮大時的最優值,解決了一般學習方法難以解決的問題,如神經網絡的局部最小問題、過學習以及結構和類型的選擇過分依賴于經驗等固有的缺陷等問題,從而提高了模型的泛化能力。另外支持向量機把機器學習問題歸結為一個二次規劃問題,因而得到的最優解不僅是全局最優解,而且具有唯一性。SVM的方法最早是針對模式識別問題提出的,Vapnik通過引入ε不敏感損失函數,將其推廣應用到非線性回歸估計中,得到了用于回歸估計的標準SVM方法,稱為回歸支持向量機(support vector regressor,SVR) [4,5]算法。
2 支持向量機回歸算法原理
SVR算法的基礎主要是ε不敏感函數(ε-insensitive function)和核函數算法[6]。若將擬合的數學模型表達為多維空間的某一曲線,則根據ε不敏感函數所得的結果就是包絡該曲線和訓練點的“ε管道”。在所有樣本點中,只有分布在“管壁”上的那一部分樣本點決定管道的位置。這一部分訓練樣本稱為“支持向量”(support vectors)。為適應訓練樣本集的非線性,傳統的擬合方法通常是在線性方程后面加高階項。此法誠然有效,但由此增加的可調參數未免增加了過擬合的風險。SVR采用核函數解決這一矛盾。用核函數代替線性方程中的線性項可以使原來的線性算法“非線性化”,即能作非線性回歸。與此同時,引進核函數達到了“升維”的目的,而增加的可調參數卻很少,于是過擬合仍能控制。
2.1 線性回歸情形
設樣本集為: ,回歸函數用下列線性方程:
最佳回歸函數通過求以下函數的最小極值得出,
(1)
其中C是設定的懲罰因子值,ξ、ξ*為松弛變量的上限與下限。
Vapnik提出運用下列不敏感損耗函數:
(2)
通過下面的優化方程:
(3)
在下列約束條件下:
求解:
(4)
由此可得拉格朗日方程的待定系數 和 *,從而得回歸系數和常數項:
(5)
2.2 非線性回歸情形
類似于分類問題,一個非線性模型通常需要足夠的模型數據,與非線性SVC方法相同,一個非線性映射可將數據映射到高維的特征空間中,在其中就可以進行線性回歸。運用核函數可以避免模式升維可能產生的“維數災難”,即通過運用一個非敏感性損耗函數,非線性SVR的解即可通過下面方程求出:
(6)
其約束條件為:
(7)
由此可得拉格朗日待定系數 和 *,回歸函數f(X) 則為:
(8)
3 基于回歸支持向量機的4-CBA含量的軟測量建模
對二甲苯(Pa r a-Xyl ene,簡稱PX)是一種重要的化工原料,通常由石腦油經過加工得來,PTA全名精對苯二甲酸(Pure Terephthalic Acid),由PX氧化得到,主要用于生產聚對苯二甲酸乙二醇酯(俗稱聚酯),聚對苯二甲酸丙二醇酯以及聚對苯二甲酸丁二醇酯。
3.1 PX氧化工藝流程
作為聚酯工業重要原材料的PTA主要由PX氧化而來。其氧化過程流程由圖1所示。在氧化反應中,4-CBA濃度是作為氧化反應進程的觀測器,其含量是PTA產品中的主要雜質及重要質量指標。根據反應機理研究,4-CBA含量過低,則表明氧化反應程度加深,副反應加劇,能耗及醋酸、PX單耗增加。而濃度過高則表明氧化反應停留時間較少,氧化反應不足,將導致PX轉化率過低,這是生產過程主要必須控制和克服的。因此為了節能降耗,并保證PTA的產品純度,一般工業要求其含量在TA中為1500~3000 。在工業生產中4-CBA含量往往通過離線光譜分析獲得,但離線的分析滯后數小時,且分析采樣次數少(一天兩三次),遠遠不能滿足控制的要求[7-9]。為了實時預測中間反應物4-CBA含量,需要建立一個能夠較精確預測4-CBA濃度的軟測量模型[10]。
圖1 PX氧化過程流程圖
3.2 軟測量模型的建立
整個PTA氧化單元包括近10個罐,整個流程的停留時間為200min左右,與最終4-CBA濃度對應的過程變量有不同的對應時間間隔。在PTA 生產過程中,DCS 系統每隔半分鐘采集一次數據,被采集的過程變量多達上百個,將這些變量全部當作模型的輸入變量是不切實際的,一方面會使模型復雜化,另一方面還會降低模型的預測能力,因此在建立軟測量模型之前需要選擇模型的輸入變量。表1給出了軟測量模型的輸入變量、變量滯后時間以及正常操作值。從實時數據庫中采集數據463個樣本用于訓練。每個樣本有10維屬性,分別代表在某一時刻工況下的操作參數,樣本輸出為4-CBA 濃度。
4 仿真實驗
本文用來估計PX氧化過程模型參數的數據全部來源于工業現場,采集到的463組數據值,以混合罐料流量、催化劑濃度、反應器溫度、反應器液位等為輸入數據,用支持向量機回歸方法為模型。在模型中,核函數選為高斯核,P=0.05,物性常數:C=100,不敏感函數:ε=0.1。圖2是PTA樣本集從x(0)到x(463)的測試過程。來預測4-CBA含量,其中紅線為模型預測值,藍點為真實值。
圖2 基于SVR模型的4-CBA含量的預測
5 結論
SVR算法基于結構風險最小化,克服了傳統方法的過學習和陷入局部最小的問題,具有很好的回歸精度和泛化能力;對于復雜的系統,用支持向量機回歸方法來提取特征樣本,用這些少量的特征樣本來估計機理模型參數,可以減少計算時間,同時避免了人工隨機試湊法選擇訓練樣本的盲目性。利用其對PTA氧化過程中4-CBA含量的進行預測,具有更快的收斂速度、更好的擬合精度和良好的預測性能,4-CBA含量軟測量的實現為PTA裝置的穩定操作和離線指導提供了依據。
參考文獻:
[1] Vapnik V. The Nature of Statistical Learning Theory[M]. NewYork,Springer,1995.
[2] 鄧乃揚,田英杰. 數據挖掘中的新方法—支持向量機[M]. 北京: 科學出版社,2004.
[3] CAUWENBERGHS G,POGGIO T. Incremental and Decremental Support Vector Machine[J]. Advances in Neural Information Processing Systems,2001,13: 409-415.
[4]Vapnik V. The Nature of Statistical Learning Theory[M]. New York: Springer2Verlag,1999,2nd ed.
[5]Vapnik V. An overview of statistical learning theory[J]. IEEE Transactions on Neural N etworks,1999,10(5): 988-999.
[6] 榮岡,金曉民,王樹青. 先進控制技術及應用: 軟測量技術及其應用[J]. 化工自動化及儀表,1999. 26(4): 70-72.
[7] 俞金壽,劉愛倫,張克進. 軟測量技術及其在石油化工中的應用[M], 北京: 化學工業出版社,2000.
[8] 李修亮,蘇宏業,褚健.基于在線聚類的多模型軟測量建模方法[J]. 化工學報,2007,58(11): 2834-2839.
[9] 李海青,黃志堯. 軟測量技術原理及應用[M]. 北京: 化學工業出版社,2000.
[10] 汪永生. 軟測量理論、方法、軟件包及其工業應用研究[C]. 上海交通大學,2000. 43-48.
摘自《自動化博覽》2010年第三期