編者按:
隨著物聯網、云計算、移動互聯網、大數據、人工智能等新技術的飛速發展,以及IT與OT技術的進一步融合,工業制造、城市交通、電力能源、農業等各大行業領域的智慧化發展已成為必然趨勢。推進各領域向智慧化發展是一項復雜而龐大的系統工程,既需要單一技術與裝備的突破應用,還需要系統化的集成創新。智慧系統解決方案是推廣普及智能化技術的關鍵手段,是促進各行業智能化水平提升的核心。
為深化智慧產業發展,進一步提升智慧產業各領域系統解決方案應用水平,現由中國自動化學會、智能制造推進合作創新聯盟、工業控制系統信息安全產業聯盟、邊緣計算產業聯盟、中國儀器儀表行業協會主辦,《自動化博覽》雜志社&控制網(www.miconline.com.cn)承辦的“2018智慧系統解決方案征集”活動已正式啟動,面向全行業公開征集智慧系統解決方案。本刊特開設智慧系統解決方案專欄,刊發其中優秀的解決方案以饗讀者。
鋼鐵行業的信息化網絡發展周期一般都比較長,隨著行業的變動,信息化的發展缺少整體的規劃,導致信息系統架構分散、獨立,業務積累到一定程度之后,形成了多個信息孤島,不僅無法實現有效的數據互融互通,甚至連基礎的數據安全也難以保證,本方案以東北某鋼鐵企業信息化為例,通過軟件定義存儲實現對現有基礎存儲的整合與改造,目的是采用盡可能少的投資和業務影響來實現架構的整合和升級改造,為大數據與智能制造提供一個健康的基礎數據平臺。
1 鋼鐵行業信息化現狀
目前我國鋼鐵企業一般都采用一級、二級、三級、四級的概念來對信息化的功能進行區分,一級、二級、三級都有了一定的積累,有的已經達到比較高的水平,雖然不同鋼鐵企業具體自動化程度有所不同,但從整個行業看,基礎自動化、過程自動化在鋼鐵企業中得到了廣泛應用,并伴隨自動化技術的發展而逐步加深,互聯網的發展推動了無紙化辦公,推動了各種生產管控,推動了ERP系統的發展,逐漸地形成了四級系統。這種分層的結構很好的區分了現場控制,過程控制,制造執行,經營管理的職能,但是卻也因為發展的時期不同,采用的技術不同,缺少統一的管理規劃等原因,導致各級系統之間缺乏聯動。由于各級使用不同廠家的產品。上線時間跨度也比較大,上線系統上線時缺乏信息化整體規劃概念,各級系統的硬件環境多為單臺PC服務器,有些服務器甚至連硬盤RAID保護都沒有,系統上線后硬件缺乏維護,硬件上的應用數據和環境沒有備份,使各級系統運行在一個薄弱而獨立的硬件環境中。雖然有些鋼鐵企業的四級網絡已經有了一定的規模,具備了虛擬化甚至云計算的環境,但是卻無法突破一級、二級、三級網絡之間的物理限制,無法對下級網絡中的各系統進行管理和運維。
以我看到的環境為例,一套工業系統,運行在一臺Dell的pc服務器上,單機運行,服務器只有一塊硬盤,預裝的英文Win2000系統,上面的應用就更為復雜。這樣一臺服務器放置在生產廠區中,沒有一個合格的機房環境。大約7年后,這臺服務器硬件故障,配套的硬件早已經停產了,上面的整套系統根本無法遷移出來。這種情況在鋼鐵行業中并不少見,陳舊的應用系統控制著價值過千萬,甚至上億的設備,但是這些控制系統卻少有備份。
鋼鐵企業信息化是一項龐大而復雜的系統工程,然而信息化浪潮的快速襲來使部分鋼鐵企業為趕潮流不落后于其他企業而倉促上馬信息化項目,導致其信息化建設缺乏必要的深入調研,對自身情況、需求以及信息化缺乏深入客觀的認識,致使其信息化項目的整體規劃不合理。
2 問題分析
從上述的現狀中,不難看出鋼鐵行業中的四級網絡一般都建設的相對成熟,而二級、三級網絡因為種種原因,多數處于一個相對落后,獨立的狀態,也因為這樣,讓底層各級網絡暴露出了很多的風險和問題。
(1)系統獨立,讓各個信息系統成為了安全孤島
由于缺乏整體規劃,系統上線時候很少會考慮到硬件和網絡層面的架構方案,整個硬件系統都比較簡單,缺乏冗余架構的保護,多數都是單臺服務器運行,讓一個個信息系統成為孤島,甚至連基本數據和系統環境的備份都沒有。
(2)設備獨立,資源浪費
硬件的發展和成本的降低讓服務器的配置越來越高,但是對于一個個獨立的服務器來說,更多的硬件資源卻無法發揮作用。每套獨立的系統消耗著電力,溫度,環境等無形的資源卻只能發揮出不到一半的效率,這種情況造成了極大的浪費。
(3)基礎生產數據無法有效采集、分析、利用
由于基礎工業控制模塊上線比較早,缺乏整體的規劃,目前鋼鐵行業中的基礎工業控制模塊相對都比較獨立,很多地方都是整個生產線,或者整個生產廠共用一個工業儀表,基礎的生產數據無法準確地反映,缺乏良好的網絡環境,讓這些數據也無法準確有效的傳輸到二級、三級和四級網絡中用來做生產數據分析。這就讓管理層與底層的生產數據之間沒有有效的信息溝通,無法及時了解真實的生產數據,難以做出準確的生產預判。
傳統鋼鐵行業信息化架構如圖1所示。
圖1 傳統鋼鐵行業信息化架構
3 方案設計
為了改變現有二級、三級中信息孤島,單一設備,數據,應用缺乏安全保護,存儲資源沒有充分利用等問題,我們把二級、三級、四級結合,搭建一套完善的虛擬化云環境,將原本獨立分離的各級工業控制系統遷入到云環境中,實現資源池化,統一管控。為了支撐這樣的虛擬云架構,我們采用了IBM SVC虛擬化存儲,通過SVC實現兩地三中心架構來形成一個堅固的信息化安全架構。
由于鋼鐵行業受生產廠區影響,信息化網絡相對都比較集中,根據實際的需求以及地域性的限制,方案采用SVC Stretch Cluster,和Global Mirror的方式實現兩地三中心架構,徹底消除了原有網絡架構中的豎井式架構,如圖2所示。
圖2 新型鋼鐵行業信息化架構
(1)首先,我們采用IBM SVC設備來對現有的異構存儲進行整合。
鋼鐵行業的存儲很多時候都是隨著一個應用項目上線,但缺乏整體考慮的項目上線往往造成了多臺性能不高,資源不足的存儲同時存在與網絡中,每套存儲只服務一個或者幾個應用系統,無法發揮更好的性能,形成了一個個的單點故障。為了解決這種情況。我們首先要先通過SVC來整合現有的異構存儲,充分利用現有的硬件資源形成資源池。
要實現多種品牌、型號的存儲的異構整合,就要解決磁盤利用率,數據遷移停機時間,跨存儲數據拷貝,統一管理,擴容許可這些問題。而要解決這些問題也有多種的虛擬化方式來解決,這里我們選用了性價比更高,更穩定高效的基于中間層的虛擬化產品IBM SVC,因為:
SVC具備靈活的磁盤管理功能,極大地提高了存儲管理的效率,例如可動態創建和擴展邏輯卷等。而且,SVC為各種不同的存儲設備提供了一個統一的數據復制平臺, 例如瞬間復制FlashCopy和遠程復制Remote Mirroring。這些復制功能都允許源磁盤卷和目標磁盤卷可以存在于不同品牌的磁盤陣列上。
透明的數據遷移:當SVC被加入到一個現有的SAN環境中時,不需要做數據遷移,SVC把現有的磁盤配置原封不動的繼承下來(這是SVC的Imagemode),這樣對服務器上的應用是完全透明的。當SVC完全配置好以后,它又可以將原先磁盤上的卷及數據透明地遷移到其他真正的虛擬卷中。所有的遷移過程對服務器透明,因此不需要中止應用。
IBM SVC是一個軟硬件集成化的產品,專業的虛擬存儲軟件運行在集群式的硬件引擎上。它使用了定制的IBM System x服務器,運行的存儲操作系統基于Linuxkernel。與SAN網絡接口是工業標準的HBA卡。由于SVC是為一個完全開放的存儲環境設計的,兼容各種不同的存儲設備。用戶可以將各種存儲方案融合其中,而不用擔心SVC會有什么封閉性。 SAN Volume Controller天生具備靈活的擴展能力,可以使用戶在存儲性能和存儲容量方面平滑無縫地升級。
例如,擴展控制器個數可以增加性能,而往存儲池中增加磁盤則可以增加容量,這兩方面的擴張都可以在線完成,不需要中止應用。SVC的主控臺提供了自動向IBM服務中心報警和遠程支持的能力。
靈活開放的體系結構;
易于實施;
易于在性能和容量雙向發展;
企業級的高可靠性和穩定性;
提供 SSD固態盤和 Easy Tier的支持;
對固態設備(SSD)的創新緊密集成支持專為關鍵應用程序數據提供超高的性能SVC架構可將SSD的性能和容量擴展至高達2.4TB和每秒800,000次讀I/O,卻只需極小的入門級配置,這有助于使SSD更加經濟實惠。將數據移入/移出SSD,而不造成中斷;在硬盤驅動器上創建固態驅動器數據的副本。
(2)為了消除突發故障導致的核心生產業務中斷,方案中采用SVC StretchCluster拉伸式集群架構來搭建生產中心第二機房,與第一機房形成雙活架構。
基于vDiskMirror特性,將SVC集群的兩個節點分別部署在兩個站點。兩個站點間通過光纖連接,形成集群。在兩個站點分別連接不同的存儲陣列,兩個站點間的SVC節點處于同一個集群,每個站點占一半的SVC節點。通過這種方式,提供存儲雙活解決方案。
SVC Stretchcluster的風險在于同一I/O GROUP只有兩個SVC節點,本地一個,災備一個。本地SVC節點故障,則切往了災備SVC節點,冗余度來說,本地有點單點的感覺;另外SVC Stretch cluster對兩個站點間的鏈路要求很高,需要穩定度高,時延和抖動盡量小,如果兩中心間鏈路中斷,那么兩個中心的SVC節點讀寫將HOLD住,直到第三站點仲裁選舉出勝利站點,如果所有業務主機均通過SVC節點訪問存儲,所有業務將有一段時間被中斷,中斷時間取決于兩個站點間距和仲裁時間。而在本方案中之所以選用這種方式,是基于鋼鐵行業的特點考慮
鋼鐵行業的生產基地往往規模都比較大,又相對集中,形成一定規模的區域,網絡覆蓋距離廣,所有生產信息點的匯聚受地理條件限制,無法像銀行,政府一類的單位實現大跨度的雙活結構,所以本方案中的雙活機房距離相對較近,兩機房之間有條件直接鋪設多條專用的主干光纜來既實現雙活又最大限度的消除延遲,抖動等線路質量的影響。
鋼鐵行業的信息化發展參差不齊,但基本上都有了一定規模,無法按照全新網絡架構一樣去考慮雙活,要做到盡可能小地影響現有的生產業務,又要實現業務的高可用,就只能逐步去改造信息架構,通過分步實施來降低全面的架構改造帶來的風險。
鋼鐵行業中,多數現存大量的存儲和設備,全新的架構改造會造成這些設備資源的浪費,通過分步實施,充分利用現有的硬件資源逐步實現雙活,對于低迷的鋼鐵行業來說,可以一定程度減輕企業的負擔。
對于鋼鐵行業,生產、辦公的信息化為內部訪問,業務訪問量相對穩定,業務的波動也是有跡可循,所以一般不會出現無法預估的突發訪問,引起上層系統由于資源不足而在兩節點中遷移。
綜合這些原因,在方案采用了SVC Stretch Cluster架構。
(3)因為方案中的雙活機房距離較近,為了應對極端情況,如地震、水災等人力可抗因素,方案中又增加了一個應急數據中心。
在異地建設一套獨立機房,通過Global Mirror實現與主生產區中的生產數據同步,作為生產數據的最后屏障,確保生產機房遭遇極端情況時候臨時生產指揮中心。在應急中心中,采用全冗余架構來保證設備的安全性,最大限度保證生產數據安全。
4 方案價值
在現有的鋼鐵行業中,可以對整體方案進行分步實施,先進行異構存儲整合,然后建立新的生產機房,進行線路改造,投入性能更好,更穩定的存儲來作為第一機房,將原有的核心機房降級為第二機房,與第一機房形成雙活存儲架構,配合上層虛擬云的HA,實現生產系統的高可用架構。建設應急數據中心,實現對數據中心的災備環境。
分步的方案實施可以最大限度保證項目成功落地運行,充分地利用現有資源完成存儲虛擬化,系統虛擬化的云平臺底層架構,然后建設新的機房來與現有生產環境對接形成雙活中心,配合異地的數據容災對生產數據形成全面的保護。而其中最底層也是最重要的,就是存儲虛擬化的架構。通過SVC實現存儲虛擬化的私有云環境擺脫了傳統存儲架構的限制,易于擴展、自動化、基于策略或者應用的驅動、透明性、虛擬數據路徑等方面都是傳統存儲架構所無法比擬的,而且還可以將現有的不同規格的舊存儲進行統一管理,有效利用現有的資源,這降低了鋼鐵行業信息化的投入成本,讓那些運行了3年、5年的設備可以作為輔助存儲來完成新舊存儲的升級更換。
摘自《自動化博覽》2018年7月刊