摘要:崖城氣田南山基地的ESD系統(tǒng)是基于Rockwell Allen-Bradley PLC5來(lái)實(shí)現(xiàn),該系統(tǒng)的可靠性和穩(wěn)定性密切關(guān)系到南山基地的安全生產(chǎn)。近來(lái)南山ESD系統(tǒng)多次出現(xiàn)故障,該故障直接導(dǎo)致全廠區(qū)緊急關(guān)停,對(duì)安全生產(chǎn)造成了一定的影響。通過(guò)全面收集故障現(xiàn)象,深入分析故障現(xiàn)象,最終找到了原因,在不停輸?shù)那闆r下,在線更換卡件,解決了該故障。關(guān)鍵詞:PLC;遠(yuǎn)程I/O 鏈路;ASB 模塊;不停輸
1 背景介紹
中海油崖城氣田是目前國(guó)內(nèi)最大的海上氣田,三亞南山基地是其陸地油氣處理基地,負(fù)責(zé)把海上送下來(lái)的油氣進(jìn)行處理和銷(xiāo)售。整個(gè)基地處理高度集成,自動(dòng)化控制程度很高。自動(dòng)化控制系統(tǒng)由集散控制系統(tǒng)(DCS),緊急關(guān)斷系統(tǒng)(ESD)火警系統(tǒng)組成。ESD系統(tǒng)是氣田緊急關(guān)斷系統(tǒng)(Emergency shut down),也是設(shè)施保護(hù)系統(tǒng),是基地油氣處理設(shè)施的重要組成部分,對(duì)于氣田的安全生產(chǎn)起到至關(guān)重要的作用。按照安全獨(dú)立原則要求,獨(dú)立于DCS集散控制系統(tǒng),其安全級(jí)別高于DCS。
2010年初,南山發(fā)生生產(chǎn)關(guān)斷和緊急關(guān)斷。維修儀表人員前往中控室,上線ESD系統(tǒng)PLC 程序,發(fā)現(xiàn)在程序中輸入點(diǎn)從I:71/00---I:71/17;I:72/00---I:72/17;I:75/00(生產(chǎn)報(bào)警),I:75/01(撤離),I:75/02(緊急集合),I:75/03(緊急關(guān)停),---I:75/17 共3組數(shù)據(jù)48個(gè)開(kāi)關(guān)輸入點(diǎn)的值大部分為0,如一些液位開(kāi)關(guān)信號(hào),來(lái)自倉(cāng)庫(kù)火警系統(tǒng)關(guān)停信號(hào)。該3組數(shù)據(jù)均來(lái)自其對(duì)應(yīng)的所有3塊數(shù)字輸入模塊,故產(chǎn)生了誤關(guān)停。根據(jù)生產(chǎn)恢復(fù)的需要,儀表在ESD系統(tǒng)PLC程序中將相關(guān)的開(kāi)關(guān)量輸入點(diǎn)進(jìn)行了邏輯強(qiáng)制,操作并對(duì)相關(guān)模擬量的輸入點(diǎn)在旁通操作站進(jìn)行了旁通,按照程序進(jìn)行了記錄。至此,生產(chǎn)關(guān)斷和緊急關(guān)斷得以復(fù)位。因?yàn)?,控制斷塞流捕集器和減壓站上兩個(gè)SDV-2102和SDV-2123的輸出點(diǎn)是掛在ESD系統(tǒng)遠(yuǎn)程I/O機(jī)架的輸出模塊上的,當(dāng)遠(yuǎn)程I/O適配器ASB模塊與PLC處理器通訊故障時(shí),輸出點(diǎn)無(wú)法帶電,只能到現(xiàn)場(chǎng)進(jìn)行操作,兩閥打開(kāi)。而銷(xiāo)售計(jì)量撬 SDV-4033能夠正常打開(kāi),因?yàn)榭刂芐DV-4033的輸出點(diǎn)是掛在另一個(gè)遠(yuǎn)程I/O機(jī)架輸出模塊上的,這個(gè)遠(yuǎn)程I/O機(jī)架和PLC 處理器通訊正常。恢復(fù)生產(chǎn)后,現(xiàn)場(chǎng)人員對(duì)有通訊問(wèn)題的遠(yuǎn)程I/O機(jī)架進(jìn)行了斷電,然后上電的復(fù)位操作后,兩塊輸出卡上電,程序里輸入點(diǎn)的值與現(xiàn)場(chǎng)輸入卡的點(diǎn)的狀態(tài)一致,PLC處理器掃描到了遠(yuǎn)程機(jī)架 I/O中的輸入輸出,遠(yuǎn)程適配器ASB 模塊ACTIVE狀態(tài)燈由閃綠變?yōu)槌>G,及時(shí)恢復(fù)了ESD系統(tǒng)。
類似故障現(xiàn)象在2008年和2009年也出現(xiàn)過(guò)多次,同一遠(yuǎn)程機(jī)架 I/O不定期失效的根本原因還有待進(jìn)一步排查。
2 故障現(xiàn)象收集
2.1 故障現(xiàn)象一
遠(yuǎn)程 I/O 機(jī)架適配器ASB模塊上的三個(gè)狀態(tài)指示燈的狀態(tài)分別為:
ACTIVE:綠色閃爍;
ADAPTER FAULT:滅;
I/O RACK FAUL:滅。
查找PLC 手冊(cè),該警報(bào)描述為:Remoteadapter not actively controlling I/O; 引起該警報(bào)可能的原因:Processor is in program or testmode; Scanner is holding adapter module in faultmode.
正常的狀態(tài)應(yīng)分別為:
ACTIVE:常綠;
ADAPTER FAULT:滅;
I/O RACK FAUL:滅,如圖1所示。
圖1 ASB remote I/O adapter 模塊
2.2 故障現(xiàn)象二
通過(guò)檢查遠(yuǎn)程I/O機(jī)架輸出卡輸入卡件狀態(tài),發(fā)現(xiàn)說(shuō)明其對(duì)應(yīng)的來(lái)自現(xiàn)場(chǎng)的變送器模擬信號(hào),液位開(kāi)關(guān),壓力開(kāi)關(guān),手動(dòng)按鈕,SDV的限位開(kāi)關(guān),來(lái)自倉(cāng)庫(kù)火警系統(tǒng) PLC關(guān)停警報(bào)信號(hào)在卡件上的顯示燈均正常,為閉合帶電狀態(tài)。但是在PLC 程序數(shù)據(jù)文件中,發(fā)現(xiàn)其對(duì)應(yīng)的值卻為0,正常應(yīng)為1。說(shuō)明現(xiàn)場(chǎng)的設(shè)備本身均為正常,只是PLC處理器無(wú)法掃描到這些遠(yuǎn)程I/O,在程序數(shù)據(jù)表里值為0。
2.3 故障現(xiàn)象三
通過(guò)檢查遠(yuǎn)程I/O機(jī)架輸出卡上的輸出點(diǎn)對(duì)應(yīng)的紅色狀態(tài)燈全部為滅的狀態(tài),說(shuō)明沒(méi)有電壓信號(hào)輸出到閥門(mén)和馬達(dá)。但是在程序數(shù)據(jù)表中發(fā)現(xiàn)這些輸出點(diǎn)對(duì)應(yīng)的值為1。說(shuō)明遠(yuǎn)程I/O機(jī)架輸出卡無(wú)法通過(guò)remoteI/O 鏈路通訊電纜接收到處理器中這些狀態(tài)為“1“的輸出指令,如圖2所示.
圖2 故障時(shí)的遠(yuǎn)程I/O機(jī)架輸入輸出卡
2.4 故障現(xiàn)象四
在PLC程序中發(fā)現(xiàn):channel status的1B口的Rack7和Rack10顯示F, F即表示該 Rack為fault。有故障的遠(yuǎn)程I/O機(jī)架均為Rack7和Rack10。1B口為remote I/O scanner通信口,連接的為remote I/O 適配器。并發(fā)現(xiàn)Rack7和Rack10有很多的retries,其他的rack均為0 個(gè)retries,如圖3所示。
圖3 故障時(shí)在FPS 程序中顯示的scanner channel的狀態(tài)
2.5 故障現(xiàn)象五
恢復(fù)生產(chǎn)后,PLC 處理器上的CH1的1B通信口的狀態(tài)燈為“綠色閃爍” 。正常應(yīng)該為常綠。1B通信口是用來(lái)連接remote scanner 和remote I/O adapter 的,如果出現(xiàn)“綠色閃爍” ,說(shuō)明at least one remote adapter is faulted or failed。hhhhhhhh可能的原因:power off at remote rack or communication cablebroken。在做好相關(guān)的旁通和邏輯強(qiáng)制后,對(duì)故障遠(yuǎn)程I/O 機(jī)架進(jìn)行斷電然后上電的復(fù)位操作后,以上的故障現(xiàn)象立即消失,ESD系統(tǒng)工作正常。
根據(jù)以上的5個(gè)最直觀的現(xiàn)象,現(xiàn)在可以得出的結(jié)論是:故障遠(yuǎn)程I/O 機(jī)架的輸入和輸出卡是完全正常的。問(wèn)題就在于PLC處理器掃描不到故障遠(yuǎn)程I/O 機(jī)架致使處理器和該遠(yuǎn)程I/O 機(jī)架無(wú)法通訊,導(dǎo)致了緊急關(guān)?!,F(xiàn)在要做的工作就是查找,故障遠(yuǎn)程I/O 機(jī)架間接性出現(xiàn)故障的根本原因。
3 故障分析
可能處理器和故障遠(yuǎn)程I/O 機(jī)架 remote I/O鏈路通信出現(xiàn)了故障。有可能是受到了一些噪聲干擾,比如大功率的馬達(dá)或者電焊機(jī)突然啟動(dòng)或者通信電纜信號(hào)屏蔽線損壞等。這個(gè)可能性還是存在的。驗(yàn)證該可能性是否存在,只要調(diào)查當(dāng)天發(fā)生故障時(shí)該區(qū)域進(jìn)行的相關(guān)作業(yè)就可以。通過(guò)檢查歷史作業(yè)記錄,發(fā)現(xiàn)發(fā)生故障時(shí)并沒(méi)有類似的操作。并且故障時(shí),發(fā)現(xiàn)Rack10和Rack11 remoteI/O 工作正常。因?yàn)樗械膔ack是前后串接,所以就說(shuō)明通信電纜是沒(méi)有問(wèn)題的。至于終端電阻,標(biāo)準(zhǔn)配置為82歐姆,與處理器掃描器處的終端電阻相等。終端電阻大小選擇與通信波特率、通信距離以及處理器的版本系列號(hào)等因素有關(guān)。終端電阻是為了消除在通信電纜中的信號(hào)反射,保證信號(hào)的通訊質(zhì)量。在remote I/O鏈路通信過(guò)程中,有兩種原因?qū)е滦盘?hào)反射:阻抗不連續(xù)和阻抗不匹配。阻抗不連續(xù),信號(hào)在傳輸線末端突然遇到電纜阻抗很小甚至沒(méi)有,信號(hào)在這個(gè)地方就會(huì)引起反射。這種信號(hào)反射的原理,與光從一種媒質(zhì)進(jìn)入另一種媒質(zhì)要引起反射是相似的。消除這種反射的方法,就必須在電纜的末端跨接一個(gè)與電纜的特性阻抗同樣大小的終端電阻,使電纜的阻抗連續(xù)。由于信號(hào)在電纜上的傳輸是雙向的,因此,在通訊電纜的另一端可跨接一個(gè)同樣大小的終端電阻。引起信號(hào)反射的另個(gè)原因是數(shù)據(jù)收發(fā)器與傳輸電纜之間的阻抗不匹配。這種原因引起的反射,主要表現(xiàn)在通訊線路處在空閑方式時(shí),整個(gè)網(wǎng)絡(luò)數(shù)據(jù)混亂。要減弱反射信號(hào)對(duì)通訊線路的影響,可以通過(guò)在兩端跨接兩個(gè)匹配的終端電阻來(lái)消除。前兩次出現(xiàn)故障時(shí),均是更換了終端電阻,給故障機(jī)架進(jìn)行斷電,然后上電復(fù)位后上述故障現(xiàn)象消失。作為一個(gè)功率為0.5W的金屬鍍膜的電阻,才更換4個(gè)月左右的時(shí)間就會(huì)壞,這種可能性還是很小的,并且為什么2008年之前十幾年了沒(méi)有壞,最近今年卻連續(xù)“壞了”3次。所以從某種程度上來(lái)說(shuō),這三次故障和終端電阻沒(méi)有什么直接的關(guān)系。還存在更深一層次我們沒(méi)有發(fā)現(xiàn)的根本原因。每次更換終端電阻不能解決根本問(wèn)題。
如果故障遠(yuǎn)程I/O 機(jī)架適配器ASB模塊自身不穩(wěn)定,會(huì)造成這種故障。ASB 模塊本身就是介于故障遠(yuǎn)程I/O 機(jī)架與處理器之間。以串行方式接收來(lái)自處理器的數(shù)據(jù)和向處理器發(fā)送數(shù)據(jù);支持半槽、單槽,二槽I/O尋址,掃描機(jī)架里的槽位信息。基于前面詳細(xì)列舉的5個(gè)故障信息,都足以說(shuō)明是該適配器 ASB 模塊出現(xiàn)了故障。該5種故障現(xiàn)象與ASB 模塊的功能是完全匹配的。第5個(gè)故障現(xiàn)象就說(shuō)明了問(wèn)題在于其中某一個(gè)remote I/O,否則我們還會(huì)花更多的精力和時(shí)間去排除鏈路上的其他設(shè)備,或者處理器或者UPS電源等;現(xiàn)場(chǎng)的輸入信號(hào)均為1,但是輸入卡的信號(hào)無(wú)法發(fā)送到處理器,導(dǎo)致程序中對(duì)應(yīng)的輸入點(diǎn)為0;程序中通過(guò)邏輯運(yùn)行的輸出值與現(xiàn)場(chǎng)輸出卡對(duì)應(yīng)的輸出點(diǎn)的狀態(tài)不相匹配,如程序中輸出為1,現(xiàn)場(chǎng)輸出卡卻為0;更直觀的是捕捉到了ASB模塊的故障診斷燈出現(xiàn)了綠色閃爍這一現(xiàn)象,說(shuō)明問(wèn)題的確是出在ASB 模塊;第4個(gè)故障現(xiàn)象也說(shuō)明了就是該Rack7和Rack10出現(xiàn)了fault,三次故障時(shí)均有該警報(bào)出現(xiàn)在程序中;綜合對(duì)以上5個(gè)故障信息的分析,基本上我們可以得出故障就位于已經(jīng)使用了十幾年的適配器 ASB 模塊上。至于ASB 模塊的故障是何引起,我們調(diào)查了這三次故障的共同歷史背景信息,大概判斷可能是由于室內(nèi)工況溫度較高,導(dǎo)致ASB模塊某些電子元件受高溫老化,工作穩(wěn)定性下降。目前室內(nèi)冷凝器工作正常,溫度控制恢復(fù)正常。
4 故障解決方案
故障原因確定后,接下來(lái)的工作就是解決該故障??紤]到之前室內(nèi)工況溫度較高,并且ESD 系統(tǒng)的重要性以及不影響生產(chǎn)的前提下在線更換ESD系統(tǒng)卡件的復(fù)雜性,現(xiàn)場(chǎng)計(jì)劃更換ASB 適配器模塊,同時(shí)一起更換已經(jīng)使用超過(guò)17年的機(jī)箱和電源模塊,確保ESD系統(tǒng)工作的高度可靠性和穩(wěn)定性。由于AB產(chǎn)品不支持熱插拔作業(yè),所以該工作必須在遠(yuǎn)程I/O機(jī)架完全斷電的前提下才能進(jìn)行;并且現(xiàn)有的新的ASB 適配器模塊均是E系列版本,在線使用的是D系列版本。換上新的機(jī)箱和ASB模塊,不能確定處理器能夠掃描到rack7和rack10。不同版本的硬件開(kāi)關(guān)組態(tài)又有不同的標(biāo)準(zhǔn),如果硬件開(kāi)關(guān)組態(tài)不正確,將會(huì)導(dǎo)致ESD 系統(tǒng)無(wú)法工作。
圖4 機(jī)架背板開(kāi)關(guān)組態(tài)設(shè)置方法
鑒于以上3點(diǎn)考慮,得出該項(xiàng)工作有3個(gè)最大的技術(shù)難點(diǎn):
(1)保證整個(gè)機(jī)箱斷電后,生產(chǎn)和設(shè)備運(yùn)行不能受到影響。因?yàn)閿嚯姾?,?huì)導(dǎo)致此機(jī)箱內(nèi)所有I/O置0,從而導(dǎo)致全廠區(qū)關(guān)停。
(2)由于ASB模塊系列版本號(hào)升級(jí)后,其中硬件開(kāi)關(guān)組態(tài)標(biāo)準(zhǔn)發(fā)生了變化。機(jī)箱母板和ASB 模塊等的硬件開(kāi)關(guān)設(shè)置比較復(fù)雜。
(3)如果換上去新的ASB模塊,出現(xiàn)處理器無(wú)法掃描到這張卡件的情況,就必須得在PLC程序中將其模式切換到PROGRAM來(lái)進(jìn)行AUTO CONFIGURE,這樣就會(huì)出現(xiàn)整個(gè)ESD系統(tǒng)輸出置0,全廠區(qū)關(guān)停。這個(gè)風(fēng)險(xiǎn)我們必須考慮并準(zhǔn)備有控制措施。
針對(duì)以上3個(gè)技術(shù)難題,我們的解決方案是:
(1) 為了保證生產(chǎn)的穩(wěn)定和連續(xù),對(duì)于輸入信號(hào),我們可以在PLC 程序中進(jìn)行邏輯強(qiáng)制和旁通,對(duì)于輸出信號(hào),由于失電,對(duì)于比較重要的關(guān)斷閥,可以在現(xiàn)場(chǎng)進(jìn)行手動(dòng)強(qiáng)制打開(kāi);對(duì)于比較重要的需要一直運(yùn)轉(zhuǎn)的馬達(dá)聯(lián)鎖信號(hào),可以在MCC開(kāi)關(guān)柜里面將繼電器進(jìn)行臨時(shí)跳接。對(duì)于消防泵,由于失電,可能會(huì)誤啟動(dòng),可以將其中切換到OFF狀態(tài),現(xiàn)場(chǎng)守候。為了保證不遺漏任何一個(gè)輸入輸出點(diǎn),打印出來(lái)所有I/O點(diǎn),核對(duì)每一個(gè)點(diǎn)并和操作一起檢查其旁通、邏輯強(qiáng)制等措施。同時(shí),由于該區(qū)域保護(hù)系統(tǒng)已經(jīng)臨時(shí)失效,需要有專門(mén)人員進(jìn)行巡檢,并隨時(shí)與中控溝通。
(2) 嚴(yán)格按照AB 手冊(cè)對(duì)其進(jìn)行硬件開(kāi)關(guān)組態(tài)設(shè)置。其設(shè)置方法如圖4圖5所示。其中圖4為機(jī)架背板開(kāi)關(guān)組態(tài)設(shè)置方法,圖5為ASB模塊S1&S2開(kāi)關(guān)組態(tài)設(shè)置方法。
(3)通過(guò)認(rèn)真研究AB手冊(cè)以及和Rockwell 廠家溝通,最終確認(rèn),如果是增加或者減少一個(gè)機(jī)箱的話,的確要在PROGRAM的模式下進(jìn)行AUTO CONFIGURE,將會(huì)導(dǎo)致整個(gè)ESD系統(tǒng)關(guān)停。我們本次作業(yè)時(shí)更換ASB模塊,沒(méi)有改變其在remote I/O通訊鏈路上的rack地址,也沒(méi)有增加或減少機(jī)架,不需AUTOCONFIGURE。在驗(yàn)證該結(jié)論的過(guò)程中,所投入的精力最多,也是當(dāng)時(shí)最難確定的。
最終落實(shí)以上3個(gè)技術(shù)方案后,于2010年3月30日在連續(xù)生產(chǎn)的前提下,成功地對(duì)更換了故障遠(yuǎn)程I/O機(jī)架的機(jī)箱,ASB和電源模塊。至今,ESD系統(tǒng)工作正常,沒(méi)有出現(xiàn)類似故障。
圖5 ASB模塊S1&S2開(kāi)關(guān)組態(tài)設(shè)置方法
5 結(jié)論
ESD系統(tǒng)再?zèng)]有出現(xiàn)類似故障,說(shuō)明故障得到徹底解決,也證明只要有正確的方法,深入細(xì)致的故障診斷和充分的準(zhǔn)備,在不停輸?shù)那闆r下可以做到在線更換AB PLC-5 遠(yuǎn)程I/O 機(jī)箱卡件。
參考文獻(xiàn):
[1] Cat. No 1771-ASB Series D Remote I/O Adapter Module User Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 1995
[2] Cat. No 1771-ASB Series E Remote I/O Adapter Module User Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 2000
[3] PLC-5 Family Programmable Controllers Hardware Installation Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 2000
[4] Data Highway/ Data Highway Plus/ Data Highway II Cable InstallationManual, ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANLCOMPANY, 1994
黃若平(1982-)
男,湖北荊州人,本科,2005年畢業(yè)于長(zhǎng)江大學(xué)自動(dòng)化專業(yè),工學(xué)學(xué)士學(xué)位,現(xiàn)任中海油崖城氣田高級(jí)儀表師,主要從事于作業(yè)公司儀表和控制系統(tǒng)的現(xiàn)場(chǎng)技術(shù)工作。
王回綏(1984-)男,甘肅靜寧人,本科,現(xiàn)任中海油崖城氣田中級(jí)儀表師,主要從事于作業(yè)公司儀表和控制系統(tǒng)的現(xiàn)場(chǎng)技術(shù)工作。
摘自《自動(dòng)化博覽》2011年第十一期