★北京廣利核系統工程有限公司鄧澤凡,王桂蘭,李剛,石桂連,彭立,董曉峰
1 介紹
核電數字儀控系統(核電DCS),被稱為核電站的“神經中樞”,控制著核電站數百個系統、上萬個設備的運行和各類工況的處理過程,保障了核電站的安全運行。該系統是核電領域復雜的重大裝備,也是核電廠的保護系統,其運行的穩定性和可靠性是核安全的重要保障[1]。如果DCS系統出現故障,可能會導致核電廠的安全問題,因此對DCS系統進行巡檢是至關重要的[2]。
本文將介紹一種基于核電DCS系統的智能在線巡檢設計,該設計可以實時監控DCS系統的運行狀態,包括各種設備的健康參數、運行狀況、環境因素等,幫助管理人員及時掌握系統運行情況,并發現潛在問題。該設計可以通過數據分析和處理,提前預警可能出現的問題,指導管理人員開展隱患治理和設備維護工作。該設計可以實現自動化、智能化的管理,提高了巡檢的準確性和效率,減少了人力成本,為核電站的安全穩定運行提供了有力保障。
本文首先在第二部分介紹了當前核電DCS系統的巡檢流程,并討論了核電DCS系統巡檢的痛點,得到了智能在線巡檢的設計需求;其次在第三部分具體說明了核電DCS智能在線巡檢設計(包括8個功能設計及流程:巡檢工作設置、巡檢數據的存儲、在線記錄設備健康狀態、在線記錄設備異常報警、在線檢查環境參數、現場檢查設備和環境信息、生成電子化巡檢報告和配置巡檢工作設置模板)、智能在線巡檢的運行架構設計、數據交互設計和業務架構設計;最后,在第四部分依據上述設計搭建原型驗證了核電DCS智能在線巡檢功能,并給出了結論。
2 核電DCS系統的巡檢需求
2.1 當前核電DCS系統的巡檢流程
目前核電DCS系統由工程師在現場檢查設備狀態,并對設備相關信息進行收集,再通過人工的方式記錄下來。核電DCS系統的日常巡檢要求包括檢查各種設備的運行狀態,如服務器、工程師站、打印機、機柜、風扇、照明燈等,確保它們都處于正常工作狀態[3]。此外,也需要檢查系統的各種參數,如環境溫度、相對濕度等,確保它們符合規定的范圍。這些工作都是人工完成的。在做好一般系統和設備巡檢工作的基礎上,工程師要確保重點系統和設備,需要人工選取巡檢的設備范圍和需要查看的參數。設備的巡檢需要按照一定的順序進行,例如以廠房為單位,以系統為中心,按系統流程的順序,檢查相關的設備,工程師需要確認巡檢路線并在完成每項檢查后進行記錄[4]。
每次巡檢完成后,工程師需要進行詳細的記錄,包括巡檢的時間、巡檢的內容、發現的問題以及采取的措施等。這些記錄對于了解系統的運行狀況以及進行后續的維護工作非常有幫助。由于核電安全性的要求,核電DCS設備故障需進行定位和溯源分析,并形成書面事件報告[5]。綜上,總結當前核電DCS設備巡檢工作流程如圖1所示。
圖1 核電DCS設備巡檢工作流程
2.2 當前核電DCS系統巡檢的痛點
(1)設備健康監控
當前人工巡檢的內容和時間范圍有限,現有設備的可測健康參數較少,絕大部分健康檢測的數據在現役機組上沒有采集,對軟件、環境因素缺少檢查手段,只能確定檢查時刻的設備健康狀態,不能持續監測[6]。
(2)設備異常檢測
當前人工巡檢的檢查深度不足,現有巡檢憑經驗進行人工判斷和評估,缺少數據支持;同時系統存在亞健康的時候不能識別,系統負荷出現忽高忽低,但未達到報警值的時候不能及時檢測與發現[7]。核電DCS系統智能在線巡檢設計對設備異常實現了及時感知和告警,并能夠及時干預確保系統正常運行[8]。
2.3 核電DCS系統智能在線巡檢設計需求
由于核電站DCS系統運行的穩定性和可靠性是核能安全的重要保障,一些廠商也開展了核電DCS系統在線巡檢有關的技術研究工作:
中核武漢核電運行技術股份有限公司發布了核電廠DCS健康管理平臺解決方案,主要用于實現DCS系統實時健康狀態評價、長期健康狀態評價、故障診斷、故障預警、壽命評估等功能[9]。不過該系統主要監控對象為DCS硬件設備,不能對DCS軟件運行進行監控。
工業控制和自動化廠商和利時推出了具有全自主巡檢+智能運維監控功能的智慧機房系統,該系統采用機器人巡檢,通過圖像識別和視頻處理內部模型形成監控攝像頭之間的映射關系[10]。該系統主要依靠攝像頭監視設備運行狀態,可監視的設備狀態參數較少且無法感知設備內部運行狀態。
結合當前核電DCS系統巡檢的痛點和行業調研結果,本文形成核電DCS智能在線巡檢設計的需求如下:
(1)監控覆蓋內容廣,在線實時采集、監測包括DCS自身和環境相關的健康數據。
(2)支持在線巡檢和現場巡檢兩種檢查方式,利用多種先進方法提高巡檢效率,包括語音或閃爍提示等,能夠及時、準確地判斷設備的故障狀態。
(3)對巡檢數據統一管理,建立數據庫支持數據存儲、記錄和查看。
我們依據以上需求進行設計,使得核電DCS系統巡檢效率和功能得到顯著改觀,優化改進點如表1及圖2所示。
表1 智能在線巡檢優化改進點
圖2 智能在線巡檢優化項
3 核電DCS智能在線巡檢設計
3.1 智能在線巡檢功能設計
核電DCS智能在線巡檢共有8個功能設計及流程,其工作流程框圖如圖3所示。
圖3 在線巡檢工作流程圖
3.1.1 巡檢工作設置
巡檢工作設置針對當前定期巡檢項目少,新增了大量、主要設備軟硬件設備的健康參數作為檢查項。巡檢工作設置是智能在線巡檢的第一步,工程師在巡檢開始前需設置巡檢工作計劃、巡檢項目、巡檢周期和巡檢路線。
設置巡檢工作計劃是在巡檢工作開始前,對巡檢類型、執行的時間范圍、巡檢方式進行設置。
巡檢項目是在做好一般系統和設備巡檢工作的基礎上,首先要確保設置巡檢項目包括重點系統和設備。工程師可在巡檢界面設置從數據庫調取的巡檢項目信息,包括設備編碼、設備名稱、設備房間號、設備機柜編號、板卡位置。常規的巡檢項目內容包含設備環境參數和設備健康參數。
巡檢周期是針對不同系統、設備的狀況和特點制定的,既不浪費巡檢資源又保證系統、設備的狀況處于有效的監控之下。
此外,設備的巡檢需要按照一定的順序路線進行,并需要按照一定的流程順序檢查相關的設備。工程師在巡檢時需要依據虛擬平面位置地圖上標注的設備房間號和位置點,按順序檢查。
3.1.2 巡檢數據的存儲
巡檢數據的存儲是針對當前定期巡檢只檢查少量指標類、環境類參數進行的改進。巡檢數據的存儲是將采集到的設備健康參數、設備健康狀態數據和巡檢報告記入數據庫。從被檢核電DCS系統發送的軟硬件設備健康參數、軟硬件設備健康狀態數據和巡檢報告經過健康管理網傳輸到在線監測系統后,記入數據庫。對這些數據進行篩選與預處理,識別異常報警,并將報警信息和異常分析記錄記入數據庫,可作為后續巡檢工作的參考[12]。
3.1.3 在線記錄設備健康狀態
在線記錄設備健康狀態是針對當前定期巡檢方式進行的改進,其改變了當前巡檢對設備采取離線、人工、定期檢查的方式。依據巡檢工作設置的內容記錄待檢設備的健康狀態(健康、亞健康、故障)和反應系統運行狀態的重要參數,可以獲取人工巡檢無法采集的表征軟硬件設備內部運行狀態的健康參數,增加了巡檢范圍的廣度和深度。
設備的健康參數包括配置類,即設備的配置信息,如操作系統版本、平臺軟件版本、初始網絡通信配置等;指標信息,包括節點級指標信息(如節點網絡負荷、CPU負荷、內存負荷等),還包括進程級指標信息(如進程的網絡負荷、CPU負荷、內存負荷、進程句柄、進程GDI等)。此外還有采集到的系統運行日志、板卡診斷信息。
3.1.4 在線記錄設備異常報警
在線記錄設備異常報警是針對當前定期巡檢方式進行的改進,其改變了當前巡檢對設備異常采取人工記錄的方式。設備異常報警是通過對設備健康參數進行識別和匹配閾值范圍,對處于故障和亞健康閾值范圍內的健康參數觸發設備異常報警,并顯示設備的異常信息[13]。
工程師在故障信息顯示列表中,點擊某一條設備的故障信息,可進入下一界面進一步記錄故障詳情,包括異常記錄、對應的巡檢項目內容、參考閾值、巡檢結果和異常處理狀態,為設備運維活動提供輸入,并通知相關人員對發生的異常問題盡快進行處理。
3.1.5 在線檢查環境參數
在線檢查環境參數是針對當前定期巡檢方式進行的改進,其改變了當前巡檢對環境參數采取人工定期檢查的方式。環境參數主要包括外部環境的數據信息,如溫度、濕度、灰塵等[14]。智能在線巡檢利用環境傳感器采集參數,通過在線系統收集參數,依據設置的閾值判斷系統環境是否出現異常,記錄環境信息,并通過數據庫存儲。
工程師在設備環境信息列表進行檢查操作,可增加修改環境參數的巡檢記錄,也可進一步記錄環境參數詳情。
3.1.6 現場檢查設備和環境信息
現場檢查設備和環境信息是針對當前定期巡檢方式進行的改進,其簡化了現場巡檢流程并提高了巡檢的準確度。智能在線巡檢同樣支持現場檢查設備和環境信息,工程師首先通過巡檢工作計劃確認現場檢查的范圍,之后在現場掃碼確認人員已到位,通過掃碼獲取設備健康參數,現場核實設備健康異常信息,讀取并記錄現場環境信息,將現場信息上傳至數據中心。此外,當設備出現異常報警時,工程師可到現場核實設備健康異常信息,對設備異常進行處理,將設備異常處理內容記錄并上傳至數據中心。
3.1.7 生成電子化巡檢報告
生成電子化巡檢報告是針對當前人工記錄產生巡檢報告進行的改進,其可自動生成巡檢報告,可信性高,并可形成數據資產方便后續運維分析。
巡檢報告的正文是結合巡檢工作設置內容和巡檢數據在系統中自動生成的(調用數據庫字段,包括健康參數和環境參數信息);巡檢報告附錄包括在系統中記錄的設備異常報警和環境異常(在巡檢報告中默認顯示本巡檢周期內的異常信息,工程師另可配置異常信息顯示的時間范圍)以及專題分析報告(由工程師輸入,在系統中記錄作為歷史經驗反饋)。
3.1.8 配置巡檢工作設置模板
配置巡檢工作設置模板是針對當前人工記錄產生巡檢報告進行的改進,其可調取已設置的模板直接生成電子化巡檢報告。為方便工程師進行在線巡檢,可提前配置好巡檢工作設置模板,使用時可從模板庫中直接調用,不需要每次巡檢都重新設置。
工程師可配置巡檢報告模板,內容包括巡檢項目、周期、路線,為生成巡檢報告提供參考,并存入數據庫中。工程師在需要進行巡檢操作時,可直接從數據庫調用已配置好的巡檢報告模板。
3.2 智能在線巡檢運行架構設計
在核電DCS智能在線巡檢的運行架構設計中,核電DCS系統是在線巡檢的發起者,主要起到發送健康參數的功能,可將健康參數由系統內輸送到系統外。
智能在線巡檢數據中心是巡檢的數據存儲機構,存儲包括從DCS系統發送的設備健康參數、環境參數、由工程師制定的巡檢計劃和生成的電子化巡檢報告。同時,數據中心也負責記錄設備異常和設備故障預警,并對所有巡檢數據進行歸檔,方便后續的數據分析。
工程師是智能在線巡檢的執行者,負責對DCS設備狀態進行周期性的或根據現場需要非周期性的巡視檢查,并對已發生或可能發生的設備故障進行確認和記錄。
(1)巡檢前,工程師需要設置巡檢設備、范圍、巡檢周期及巡檢項目內容;
(2)巡檢中,工程師根據實時采集的DCS系統設備自身和環境相關的健康參數及設備操作日志,及時準確地判斷設備的健康狀態情況,包括健康、亞健康和故障三種,并通過多種可視化界面進行顯示,當設備健康狀態顯示為亞健康和故障時,會自動觸發故障檢測報警(故障觸發報警、亞健康觸發預警);
(3)巡檢后,工程師對巡檢內容進行確定后,自動生成電子化巡檢報告。
此外,工程師也負責配置巡檢工作設置模板,即配置適用于不同情況下的巡檢工作項,其在進行巡檢工作設置時可直接導入已配置好的模板。
智能在線巡檢運行架構如圖4所示。
圖4 智能在線巡檢—運行架構
3.3 智能在線巡檢數據交互設計
為實現在線記錄設備健康狀態、在線記錄設備異常報警和在線檢查環境參數功能,智能在線巡檢數據的交互接口設計如圖5所示,將核電DCS系統與智能在線巡檢工作臺(InspectBench)隔離,各模塊運行相對獨立,不影響原有軟件系統功能[15]。設計智能在線巡檢網關(iHMU),為智能在線巡檢工作臺(InspectBench)調用數據提供通用接口,并可將核電DCS系統內部的設備健康參數和環境參數通過健康管理網(HNET)傳出。
圖5 智能在線巡檢—數據交互設計
參考以上智能在線巡檢的數據交互設計,在核電DCS系統內部的改造工作包括通過部署在服務器上的插件(SpeAgent)采集設備健康參數[16]。此外,區別于核電DCS系統原有的管理網(MNET)和系統網(SNET),設計專用HNET將DCS系統內部的設備健康參數和環境參數傳輸到iHMU。
3.4 智能在線巡檢業務架構設計
智能在線巡檢的業務架構總體設計為B/S結構,采用前后端分離模式開發。
其中客戶層基于Uni-app開發框架技術,支持跨平臺,使用一套代碼同時開發出多個平臺的應用,可以分別打包成PC端、平板端、手機端App,可支持在多平臺應用。
應用層采用微服務軟件架構模式,將場景功能服務和公共服務進行了服務劃分,每個服務可進行獨立部署和擴展,便于維護升級,減少了服務之間的影響。其易于功能擴展,可靈活部署在一臺或多臺計算機上。
在數據層采用時序數據庫和關系型數據庫相結合的部署模式。數據層也通過第三方對接DCS系統服務數據:可調取python算法模型等進行統一管理。
智能在線巡檢業務架構設計如圖6所示。
圖6 智能在線巡檢—業務架構設計
4 核電DCS智能在線巡檢原型驗證
基于開源可視化運維軟件Grafana搭建的智能在線巡檢工作臺原型,可將軟件運維監視模塊(SpeAgent)采集到的設備健康參數進行可視化展示[16]。原型具體驗證效果如下:
首頁為巡檢工作設置。從主界面-在線巡檢進入該界面,界面顯示巡檢計劃列表和已執行的巡檢計劃。將采集到的設備健康參數、設備健康狀態數據和巡檢報告記入數據庫,如圖7所示,實現巡檢數據的存儲功能。
圖7 在線記錄設備健康狀態
在設備異常報警界面可顯示設備的異常信息,如圖8所示。工程師記錄此時系統的重要參數,結合巡檢異常結果分析,為設備運維活動提供輸入,對發生的異常問題盡快進行處理。
圖8 在線記錄設備異常報警
在智能在線巡檢工作臺可生成電子化巡檢報告,如圖9所示。其中巡檢報告正文結合巡檢工作設置內容和巡檢數據在系統中自動生成(調用數據庫字段,包括健康參數和環境參數信息),顯示內容包括基于SFMEA的軟件故障模式統計、故障模式問題等級統計和故障問題匯總表。
圖9 生成電子化巡檢報告
5 結論
本文討論了當前核電DCS系統的巡檢痛點需求,介紹了一種針對核電DCS系統的智能在線巡檢設計,包括功能設計和架構設計,并基于以上設計進行了原型驗證。總之,該設計實現了核電DCS系統設備的智能巡檢和在線健康管理,并可實時記錄設備運行狀態,為故障預警和故障分析提供了基礎,實現了核電DCS系統領域傳統人工巡檢到智能化在線巡檢的轉變,大幅提升了巡檢效率和質量。
基于核電DCS系統的智能在線巡檢設計結合了數字化與智能化的運維理念,實現了核電DCS系統的在線運維,通過設備的健康參數可監視DCS系統的長期可靠運行。未來以此為數據基礎,進行核電DCS系統設備的故障預測性維修,能夠大幅節省核電運維成本,并帶來可觀經濟效益。
作者簡介
鄧澤凡(1995-),男,北京人,工程師,碩士,現就職于北京廣利核系統工程有限公司,主要從事核電數字化儀控系統智能運維工作。
參考文獻:
[1] Zheng W Z. Application of DCS for Protection System in Nuclear Power Plant[J]. Nuclear Electronics & Detection Technology, 2012.
[2] Zhang Q, Ma Q, Han W, et al. The reliability analysis of nuclear power plant safety DCS with common cause failure[C]// Progress report on nuclear science and technology in China (Vol. 5). Proceedings of academic annual meeting of China Nuclear Society in 2017, No. 3-Nuclear Energy & Power sub-volume, 2018.
[3] 鄭北新. 核電廠安全巡視檢查[M]. 北京: 化學工業出版社, 2013.
[4] 胡聰旺, 周項超. 核電廠應用智能巡檢技術的可行性分析[J]. 科技創新與應用, 2021, 11 (28) : 3.
[5] 張英振. 學習《核動力廠運行安全規定》的體會[J]. 核安全, 2005 (1) : 8.
[6] 田露. 核電廠DCS系統運行維護管理策略研討[J]. 核動力工程, 2017 (S2) : 3.
[7] 胡聰旺, 周項超. 核電廠應用智能巡檢技術的可行性分析[J]. 科技創新與應用, 2021, 11 (28) : 3.
[8] 張朋. 核電廠數字化儀控系統故障建模及在線監測[D]. 南京: 東南大學, 2015.
[9] 尚鑫鑫, 鄒源浩, 代維佳, 等. 一種適用于核電廠的健康管理系統及方法: 202110481102[P]. 2023.
[10] Hongru Xin. 和利時智慧機房[EB/OL]. 2023. http://www.hollysys.com/cn/content/details68_2408.html.
[11] 王歡, 葛月霆, 張楠, 等. 核電廠智能巡檢方案規劃和應用分析[J]. 產業與科技論壇, 2021, 20 (23) : 3.
[12] 趙晝辰, 韓東平, 莊誠. 一種基于點巡檢數據和dcs在線數據的設備故障預測方法: CN 201010541512[
P]. CN 102063119 B[2023-09-12]. DOI:CN102063119 B.
[13] 李啟明, 李景志, 劉旭東. 核電站安全級DCS系統故障及維護策略研究[J]. 自動化博覽, 2013 (4) : 5.
[14] 周森, 成艷, 韓麗, 等. DCS遠程站遠程巡檢統: CN201620743294.1[P]. CN206019874U[2023-09-12].
[15] 劉高俊, 王婷, 倪立功, 等. 一種用于核電廠dcs實時數據的采集方法及系統: CN 201010501219[P]. CN 102044308 A[2023-09-12].
[16] 覃進學. 基于AIoT+AIOps的數據中心智能化運維實現探討[J]. 數字通信世界, 2020, 182 (2) : 115.
摘自《自動化博覽》2024年3月刊