
作者簡介:彭瑜(1938-),男,湖南長沙人,教授級高級工程師,1960年畢業于清華大學動力系,長期從事工業過程控制系統的研究開發工作,1993年獲國務院特殊津貼,現任中國自動化學會儀表與裝置專業委員會常務委員,上海市自動化學會常務理事,中國儀器儀表學會專家委員會委員。
摘 要:本文從現場總線診斷技術的發展進程、物理層診斷的必要性、物理層診斷的基本原理和診斷工具、現場總線可能發生的故障類型分析和故障檢測的高級測量技術等方面,闡述保障現場總線系統健康應用的一個重要方向的內涵及其擴展。
關鍵詞:現場總線;物理層;故障;診斷
隨著現場總線技術的發展,現場總線網絡及其相關網絡設備以及現場總線儀表和設備的應用,在質量和數量上都有長足的進展。這些日益廣泛和深入的應用,印證了美國ARC咨詢集團“使用現場總線可以節省安裝和工程成本,但最大的利益還是體現在生產裝置投運之后長期的維護和運行中”的論斷的正確性。顯然,在長期運行和維護中使用現場總線帶來的利益主要來自三個方面,即現場智能儀表和設備為工廠企業的資產設備管理提供了基本信息和實時信息;將現場儀表和設備的維護從被動的遇到故障才采取維護措施,提高到實施主動的預測性維護和預防性維護,大大減少了非計劃停車所造成損失;為生產的平穩操作和加快生產節拍準備了技術條件。
本文著重討論現場總線的故障診斷技術的問題,特別是物理層診斷的問題。這不但是因為大量現場應用所發生的影響現場總線系統正常運行的故障主要是物理層的問題,提高故障診斷和排除的速度對使用現場總線的生產設備的正常運行關系極大;而且還在于我國在應用現場總線技術開發控制系統的單位和人員的水平,以及系統的維護人員的水平參差不齊,有時候為了壓低成本或者常常是無知,沒有遵照現場總線應用和安裝的基本規范的要求,導致現場總線系統的長期處于非健康的狀況。
據Profibus國際組織對全世界范圍內300多個現場的調查統計,Profibus-DP故障率最高的5點原因中至少有四方面屬于物理層所產生的問題:
未接終端電阻或終端電阻不合要求(物理層);
動力線對信號線的影響,如靠得太近(物理層);
沒有遵循通信電纜的布線規則(物理層);
沒有遵循通信電纜的布線規則(物理層);
組態出現故障;
接口損壞或采用了未經認證的接口(物理層)。
這足可為上述物理層診斷的必要性給出佐證。
這足可為上述物理層診斷的必要性給出佐證。
1 現場總線診斷技術的發展進程
從上世紀70年代起,現場儀表和控制系統的診斷最初僅僅是一些輸出信號和I/O狀態是否正常等簡單的診斷,之后HART技術的問世為儀表和過程診斷帶來了許多新的概念和方法。不過,限于HART的主從通信機制及其處理能力和帶寬的限制,致使HART儀表的診斷能力有限,只能發出診斷報警,較為詳細的故障信息還必須由主機發出查詢后才可發出,因此有人將此歸類于所謂“被動式診斷”。自從90年代現場總線技術的發展,隨之帶來了較為復雜的傳感器和過程診斷的加速,例如對于FF智能儀表其診斷數據是作為設備反饋信息的一部分不斷地在刷新。直到最近幾年才出現了高級物理層診斷,整個系統的監控范圍大為擴展,不但可以對故障做出診斷,而且還能夠對那些尚未發生故障、但有可能發展為故障的一些問題發出預警。這就是診斷技術的進展歷程(見圖1)。

圖1現場儀表和系統的診斷技術的進展歷程[1]
與此同時,無線技術的工業應用的迅速發展,尤其是無線HART的協議公布和產品推出,又為HART儀表診斷先進、但帶寬受限給出了新的診斷信息的傳送通道。典型的HART儀表包含35~40個數字數據項,其中有最多可有4個過程測量值,以及儀表設備專用的診斷信息(如接線故障、電子電路故障、超出測量范圍等),它們都可以被用來改善工業生產的績效。圖2示出了這個思路[2]。

圖2 無線HART為智能HART數據給出了新的信傳送通道
近些年來總部設在德國的過程工業自動化技術的用戶組織NAMUR十分活躍,提出了許多推薦型技術文件,受到全球業內人士的重視和推崇。其中《現場設備的自監測和診斷》(文件號:NE 207)[3]就是專門針對現場儀表變送器和執行器提出的自監測和診斷要求,為發展現場儀表的診斷技術給出了指導性的意見。
2 物理層診斷的必要性
當決定采用現場總線控制系統的方案后,在施工、調試投運和正式運行等各個階段,都對其測試和診斷技術和工具有迫切的要求。這使現場總線診斷的發展有了明確的發展方向。尤其是現場總線系統投運以后,不少用戶反映,通信似乎是一個黑盒子,當主系統上指示產生了一個故障或發生了一個報警事件,常常不知道該如何處理。而實際上最常見的現場總線問題是:從物理層的角度看,現場總線設備不處在通信狀態,最壞的是某個設備周期性的出現不參與通信的情況;從應用層的角度看,存在傳輸過來的是無效數據(數據測量值未作校驗或有問題)。有些問題如I/O出問題可以由現場總線設備本身進行診斷。
現場總線的網絡通信出現故障,可以使用哪些工具或方法來查找故障呢?
目測(觀察現場總線設備上的指示燈)是最基本的診斷。以Profibus-DP為例,絕大多數設備上有3個發光二極管指示燈:ON,BF,SF。這些LED對維修人員極為重要,通過它們可以明確判斷設備的狀態。不過,大多數Profibus-PA儀表沒有LED指示燈,因為由總線供電,要節省功耗以及考慮防爆的功率限制。
而且這種指示只能告訴用戶發生了某種故障,常常不能給現場總線的維護人員指示問題究竟出在哪里。最重要的工具當然是網絡分析儀,但這類昂貴的儀器需要較深的專業知識,在現場使用頗多不變,因此難以普及。所以發展更有效的診斷工具就提到了日程上。
從現場總線診斷的視角看,可以將目前在工業通信中運用的現場總線劃分為三大類:①從自動化儀表發展過來的現場總線,主要是HART、FF的H1和Profibus-PA;②從PLC的遠程I/O發展過來的現場總線,主要有Profibus-DP、DeviceNet和CC-Link等,這里又可細分為基于RS 485的現場總線和基于CAN的現場總線。③專為運動控制應用開發的現場總線,如SERCOS、EtherCAT、PowerLink等。運動控制用現場總線發展較晚,目前有關的診斷工具的開發主要從網絡分析在發展,作為診斷工具尚有待于提到議事日程。前兩類現場總線的應用都有了很大的范圍,對診斷的需求呼聲很高,所以近年來發展較快。它們的物理層的原理相似,但機制有較大不同,診斷工具自然不會一樣。在以下的分析中將把它們分別展開。
3 物理層診斷的基本原理和診斷工具
以FF H1和Profibus-PA為例,其物理層由以下部分組成:主干電纜或主連接電纜,分支電纜或儀表連接電纜,端子排,置于主干電纜兩端的終端電阻器,現場總線的電源,設備接口硬件,故障保護裝置(如網段保護器等),現場總線通信的物理學(如信號等),圖3給出了物理層的構成[2]。

圖3 FF H1和Profibus-PA物理層的構成
由此可以推斷,物理層診斷就是將診斷測試設備通過現場總線主干電纜與現場總線網絡直接連接,來連續測試、監控和診斷整個網絡,及時發現網絡中各個物理部件的性能是否變壞或偏離,以防止由此引起故障或整個網段通信中斷。圖4示出在線診斷模塊在現場總線系統中的位置。還可以通過物理層診斷來證實網絡是否符合或一直符合現場總線標準,以及嚴格的設計規則。
就其功能而言,物理層診斷工具可以分為:①簡單手持式診斷設備:離線測試和初步診斷。②基本在線診斷設備:可在調試投運時進行初步的故障診斷,并可一直連在現場總線網絡上以檢測運行時的故障和查找報經原因。③移動式高級在線診斷設備:可在調試投運期間,甚至當控制系統和相關的現場總線電源都不能使用時進行高級測試,或在運行期間作詳細的故障查找。④高級在線診斷設備:可在現場總線網絡施工、調試投運和系統測試時,查找故障,按用戶定義的方式報告/制作技術文檔,以及早期給出故障預警。該設備永遠與現場總線網段相連,并在整個現場總線網絡的生命周期一直在工作。表1給出這四種診斷工具的功能比較表。

圖4 將在線診斷模塊通過現場總線主干電纜接入現場總線系統
所謂基本物理層診斷范圍包括DC電壓、DC接地、高頻、數據信號。而高級物理層診斷范圍:除基本物理層診斷范圍包括的項目外,還能診斷全部波形、AC波動情況、連線DC電流、數據的極性、AC不平衡和將波形存貯起來仔細分析(存貯示波器功能)。采用高級在線物理層診斷的優越性在于可測試和連續測試現場總線網絡的通信質量,通信電纜的基本設施狀況,現場總線用的電源、終端器和其他設備的工作狀態,網段中所有的電子電路。這樣一來,對于用戶而言,現場總線的運行狀況是可見的,透明的。一方面可加速調試運行的時間,并具有自動生成技術文檔的能力。另方面可測試現場總線系統的性能,在控制室內通過對現場總線運行狀況的監測,及時發現FCS的變化,在現場總線系統存在隱患、有可能對生產造成不良影響之前,就能發現問題,及時排除。
目前已將高級物理層診斷功能集成到現場總線FF H1的供電電源母版上,這主要是用一個在線物理層診斷模塊同時監測幾個現場總線網段,可進一步降低成本。考慮到診斷性能、設備的復雜性和硬件成本的折中,P+F公司的FieldConnex高級物理層診斷模塊設計成一個模塊可同時對4個網段進行診斷,并將它集成到現場總線的供電電源中,作為標準電源產品供貨。近年來Emerson和橫河等DCS供應商與P+F均簽有這方面的技術轉讓協議。用戶可以直接從這些廠商訂購帶高級物理層診斷的FCS系統。目前物理層高級在線診斷還僅用于流程工業現場總線的FF H1和Profibus-PA,而其他的現場總線診斷大都是移動式高級在線診斷。
表1 四種診斷工具的功能比較表
測 量 |
移動式高級診斷 |
高級在線診斷 |
手持式現場總 線測試儀 |
基本在線診斷 |
潛在故障早期診斷用所有測量項目隨時間的 去世與記錄 |
有 |
有 |
無 |
有(有限) |
主干電纜電流測量 |
無 |
有 |
無 |
無 |
抖動測量 |
有 |
有 |
無 |
無 |
數據信號幅度 |
有 |
有 |
有 |
有 |
屏蔽對信號±極的AC和DC不平衡(%) |
有 |
有 |
無 |
無 |
±極間直接短路 |
有 |
有 |
有 |
有 |
全頻譜分析 |
有 |
有 |
無(部分有) |
無(部分有) |
高頻噪聲測量 |
有 |
有 |
有 |
有 |
數字存貯示波功能 |
有 |
有 |
無 |
無 |
主干電纜電壓測量 |
有 |
有 |
有 |
有 |
高級軟件分析和硬拷貝打印輸出 |
有 |
有 |
無 |
無 |
±信號錯誤反接報警 |
有 |
有 |
無 |
有 |
分離型診斷信息總線(任何網段故障不會影響操作 |
有 |
有 |
有 |
無 |
有總線拉出零電流線 |
有 |
有 |
無 |
無 |
無需用電纜或端子盒緊靠終端器或接口 |
無 |
有 |
無 |
有 |
可同時監測所有網段 |
無 |
有 |
無 |
有 |
從現場總線安裝直到投運一直留在現場安裝點 |
無 |
有 |
無 |
有 |
4 現場總線可能發生的故障類型分析
毫無疑問,一個設計得很好又得到很好維護的現場總線網段,可以運行多年而沒有任何問題。但是,就像任何電子系統會在其生命周期內發生某些不可預測的故障一樣,現場總線系統仍然會在某些網段的某個點上會發生故障。現場總線的故障可能在任意時間發展或發生而毫無警告。損壞或故障涉及的范圍從一個不顯著的變化到一個頗為麻煩的報警,或一個致命性的事故。
為了能充分了解現場總線物理層診斷的具體內容,下面會較詳細地討論在一個廣泛的范圍內可能發生的故障類型。
· +/-極對屏蔽的故障(不平衡) 電纜導線的+/-極可能會與屏蔽接觸產生一個低電阻,這種故障出現的概率較高,一般都是因為導線的終端與儀表的外殼接觸,或是在安裝過程中電纜受到損壞。但并不是所有的故障會直接短路或者產生一個低的接觸電阻,有時有可能產生一個電容或高接觸電阻。電纜的安裝走線不良或者電纜的制造缺陷,也有可能導致電纜產生了不可接受的電容不平衡,如果儀表本身也有些不平衡,這就是情況復雜化了,有時還可能電纜受潮或不慎受到水浸,使傳導性能變壞。雖然這些問題在一段時間內可以容忍,但由此而導致由一般的小問題發展成為故障,例如產生電容對地短路和一個極直接對屏蔽短路。不平衡往往會使對噪聲的靈敏度增加,因而提高了通信出錯的幾率。
· +極對-極的故障 這種故障同樣也會發生。在主干網電纜中兩極之間的短路是不能容忍的,這會導致整個網段出現故障,也有可能并非直接短路,而是呈現一定的電阻,這時儀表的濾波電容或過載保護的半導體器件會發生漏電,電纜或接線盒浸水,也會引起此類故障。
·串線、噪聲和干擾 噪聲會以多種形式出現,且其會覆蓋整個頻譜。如果靠近變頻裝置,或電纜自身受到振動,受到電磁干擾,或從鄰近的電纜引來串線干擾,都會引發噪聲。接地回路和接地耦合噪聲會通過電纜的屏蔽傳導過來,并對主干電纜和分支電纜產生干擾。事實上,接地故障常常被認為是通信信號最大的問題,是許多禍害問題之源。現場總線標準規定了從DC到幾十兆赫茲整個頻譜噪聲電平的限制,最具破壞力是那些在通信帶寬內、且電平超過75mV(峰—峰值)的噪聲。
·終端器故障 簡單的終端器是公共的故障點。即使是有冗余電源的所謂電子終端器,其實總是主干電纜的現場側的單一終端器。終端器的故障是由于終端器的電阻被擊穿至開路而引起終端器不齊作用,或者是電阻值降低造成通信信號的嚴重畸變。終端器中的電容發生故障的形式有:開路,是終端器失效;短路,導致網段受到致命的沖擊或元器件損壞;電容值向低漂移;電容損壞呈電阻性或彼岸變成導體,以致終端器逐漸失效。
·終端過載/欠載 現場總線系統可以在一定程度上容忍終端的過載或欠載,這與網絡的配置和起始發出的信號質量有關。現場總線的電源/電源調理器,以及設備的負載也會對此有所影響。在長主干電纜的終點一旦發生終端器失效或為接入終端器,就會使通信信號產生反射,致使信號畸變。
·現場總線電源漂移或阻抗故障 現場總線電源的無源阻抗是固定不變的,而其有源阻抗則取決于電容和晶體管,當將兩個現場總線電源配成互為冗余時,這些元器件會隨時間產生漂移或損壞。有源現場總線電源的阻抗發生漂移或失效,并不一定導致信號衰減,倒是常常會使信號的頂部由平變陡,如果電容過大,會使波形的上升沿呈兩段上升折線;如果電感過大,會使波形的下降沿沿呈兩段下降折線。信號的這些畸變首先會導致“抖動”不穩定出錯,接下去在產生致命性故障前會引起多次的數據重發。
·水浸入 現場發生重大故障、接線盒密封失效或者電纜斷裂、折損或滲水,致使通信電纜浸泡在水中,或接線端子排浸在水里,這時會造成絕緣受損、導電性顯著增加,或主干電纜的電流改變、對地泄露,但一般不會引起噪聲。絕緣受損使得端子之間有導電現象產生,從而發生電蝕,隨著時間推移電纜也會受到電蝕。
·現場總線設備故障 許多現場設備內設有故障切斷電路,就是說當它檢測到破壞性的“信號”會立即自動將設備從網段中斷開。不過不是所有的問題都可以得到保護,因為在網段或分支電路上的保護器能有效動作之前有一段時間,設備的阻抗就可能發生漂移至產生破壞性的程度。為使設備能與主干電纜雙向連接,有些設備設有二極管橋路。橋路有可能損壞使阻抗變低,或者發生短路故障。
·瞬間電壓抑制二極管(TVS)和電涌放電器 為防止電壓瞬間過載損壞分支保護器和設備中的敏感電子元器件,一般總會在現場總線電源中設有TSV或電涌放電器。雖然他們能起到保護作用,但事實上它們自身又成了一個公共故障點。TVS是直接扣壓接在主干電纜,其性能的漂移或漏電、甚至可能短路,都有可能造成這些設備共有的損壞方式。在正常運行期間,TVS有可能在沒有電應力和熱應力的情況下失效,形成一個不確定的故障因素。尤其是在受到一次高電壓的浪涌其性能變差,結果導致漏電或阻抗發生有問題的改變。
·現場總線噪聲濾波電容器問題 現場設備、現場總線電源和保護電路通常都用一個小電容跨接在±極與屏蔽之間,起到噪聲濾波的作用。在一個網段中要介入好多個設備,例如接12個設備,就會接上36個電容器,故障的可能性就會大為增加。因為電容器可能開路、短路或者向低電容值漂移,結果會造成不同的作用,某些情況下可能是破壞性的,或者由于沒有引起注意導致釀成復合型的故障。
·信號極性接反 許多設備是雙極性的,這就是說有可能以任意極性與網段相連。然而有些設備如電源或中繼器是非雙極性的,這樣就有可能發生意外的極性接反問題。這使數據信號反轉,在某些時候系統容忍這種反接,不過設備之間的通信就會出問題。如果在安裝和調試投運期間極性接反了,直到正式投產,有可能好多問題還難以發現。
·現場總線供電電源的狀態正常監測和故障 現場總線電源的輸出電壓可能會在用了很長時間后超出了容許范圍。即使有采用冗余電源,由于或門二極管短路,或者有一個電源的內阻變低而使輸出變低了等原因,致使兩個電源中的任一個發生故障,都應采取緊急措施加以更換。
5 故障檢測的高級測量技術
要采用一定的測量技術才有可能在實際現場總線系統的運行過程中及時檢測出潛在故障的所在,并判別出其類型,進行早期的預警。
實際上,可以把上述故障類型檢測加以一定的分類,例如DC性質的故障檢測、AC性質的故障檢測、信號電平衰減的故障檢測、屏蔽對±極的AC和DC的故障檢測、噪聲及其干擾的故障檢測、電源的故障檢測和信號極性反接的檢測等等。
以“DC性質的故障檢測”為例,因為不論是現場設備噪聲濾波器和二極管橋的DC泄露、TVC的DC泄露、設備電壓改變的原因推斷、浸水、終端器的DC故障、設備的電流故障,以及±極之間的DC故障,所有這些可能的問題都可以通過主干電纜中流過的電流的微小變化和隨著時間而發生增量型的變化加以檢測。相對于信號電平的變化來說,主干網的電流變化的檢測能夠更靈敏的反映問題,具有較好的可檢測性。尤其是對于還在逐漸變壞著的±極受到水浸故障的早期預警、終端器中電容的漏電、設備濾波器電容或二極管橋的漏電、保護二極管(TVS)的漏電和設備電流故障或漂移,用主干電纜的電流變化來檢測問題更為有效。
再如屬于“AC性質的故障檢測”的有TVS和現場設備阻抗變化、有源電源故障或阻抗故障、終端過載或欠載、±極之間的AC故障等,抖動測量顯然是用于任意傳送中的AC故障檢測最重要的測量方法。因為抖動測量忽略特定的或分立的故障如噪聲電平或信號衰減,而集中于檢測通信數據的精確度,看數據的傳輸是否足夠的好。它可檢測由于網絡阻抗變化、信號畸變、網絡諧振、有源現場總線電源阻抗漂移、終端器電容或電阻漂移、設備濾波器電容漂移、設備阻抗故障和全帶寬噪聲的影響等所造成的信號幅度的變化。噪聲影響或信號衰減/畸變有時單獨尚滿足所求的規范的限制,不過合在一起便會產生故障。如果數據信號存在向故障變化的趨勢,用較長的時間進行抖動測量,就可以在發生數據傳輸遭遇破壞前發現問題信號電平測量可以用來檢測由于集中有源電源阻抗故障或漂移、電纜衰減、終端過載/欠載或者設備阻抗故障所造成衰減。現場總線可以在信號電平很低的情況下運行,但可能造成數據丟失,所以在信號變得低于可接受的電平之前就應發出預警。將抖動測量與信號電平測量組合使用,使我們可以更好地實現有目標的故障診斷。
并不是所有的“屏蔽對±極的AC和DC故障”都是簡單的短路,可以將它們視為不同程度的電容性和電阻性故障,由此來評定是哪個極出現問題。電容性的故障或不平衡可能是由于現場儀表中的解耦電容器損壞,或者是由于制造中的缺陷致使電纜異常的不平衡,還有可能是安裝問題。此外,浸水和現場設備噪聲濾波器的電容漂移等,常常是通過電容檢測、電阻測量來發現問題。對于那些正在因浸水而緩慢發展的±極對屏蔽的可能故障,用這種測量發出早期預警是很有效的。
至于串線干擾、噪聲干擾和電磁干擾,可以用頻帶內有害噪聲檢測,以及全頻譜分析予以檢測,對于源于終端器故障、現場總線電源阻抗故障、接地故障、串線、驅動電機等引起的低頻噪聲,更容易用全頻譜分析方法測量。
綜上所述可以知道,現場總線的物理層故障檢測是需要用很多測量方法來輔助檢測、判斷和評估的。而要把這些方法綜合在一個故障診斷系統內,除了用連接在現場總線主干電纜上的故障診斷模塊或診斷適配器來采集相關的信號和信息而外,很重要的是有一套運行于計算機中、集合網絡分析器(檢查通信協議運行質量)、示波器(通過網絡運行時測試數字通信的波形檢查信號質量,其中包括信號幅度、反射、噪聲、EMC等在內)和生成網絡故障分析報告諸功能的軟件。如果這個診斷系統是專為Profibus-DP設計的,那么它還必須是Profibus-DP的主站,具備主站所必需的諸如網絡組態、I/O測試、網絡掃描及動態清單,以及設置從站地址等功能。否則就不能進行現場總線運行時的在線診斷了。
目前能對Profibus-DP總線運行狀態進行動態檢測、分析和故障診斷,有多家公司的產品,如荷蘭PROCENTEC公司的ProfiTrace2(它包括多個部件,有ProfiCore適配器、進行動態檢測和分析的ProfiTrace、測試通信電纜的質量、終端電阻的質量、電纜短路、接線斷開、衰減情況和電纜線接反的ProfiPulse等);德國Softing公司的PB-T3型分析儀;德國ITM/ComSoft公司的IT-Monitor等。
參 考 文 獻
[1]Gunther Rogoll.Ren Kitchener,Advanced Online Physical Layer Diagnostics.P+F White Paper.
[2]A Wireless Way to Unleash the Power of HART Data.Airsprite White Paper. www.airsprite.com.
[3]Self-monitoring and Diagnosis of Field Devices.NAMUR NE 107.
——轉自《自動化博覽》