★北京郵電大學 許士勛,張奧,宋聞萱,黃瀟潔,許方敏,趙成林
摘要:工業算力網絡將算力網絡引入到工業互聯網中,實現對工業場景下算力和 網絡資源的統一編排調度,提高了資源的利用率,滿足了工業互聯網智能化發展 趨勢下低時延、高可靠的業務需求。本文在介紹工業算力網絡架構的基礎上,結 合工業任務及工業互聯網特性,對算力網絡賦能工業互聯網面臨的挑戰進行了分 析,并對實現工業算力網絡的關鍵技術進行了總結和構想。
關鍵詞:工業互聯網;算力網絡
Abstract: The Industrial Computing First Network integrates Computing First Network into the Industrial Internet to realize the unified arrangement and scheduling of computing power and network resources in industrial scenarios, thereby improving the utilization rate of resources. This facilitates meeting the service requirements of low delay and high reliability in line with the intelligent development trend of the Industrial Internet. Based on the introduction of the architecture of Industrial Computing First Network, this paper analyzes the challenges faced by Computing First Network to enable Industrial Internet, and summarizes and proposes the key technologies for realizing Industrial Computing First Network, taking the characteristics of industrial tasks and Industrial Internet into consideration.
Key words: Industrial Internet; Computing-first network
1 引言
工業互聯網作為新一代網絡信息技術和制造業的融 合產物,是實現產業數字化、網絡化和智能化發展的重 要途徑,也是實現工業環境下人、機、物互聯的重要基 礎設施。隨著工業互聯網中智能應用的部署,其對網絡 時延、可靠性及計算能力的要求不斷提高。目前,工業 互聯網中泛在的算力及網絡資源利用率低,難以滿足工 業應用的業務需求。
算力網絡是算網融合演進的新型網絡架構,通過對 計算和網絡資源統一編排調度,可以實現兩者利用率最 大化。通過算力網絡對工業互聯網賦能,構建工業算力 網絡,并進行云網邊端等計算、存儲、網絡資源的協同 調度,成為滿足工業互聯網智能業務需求的重要方式。
目前,工業算力網絡的發展尚處于起步階段,演 進路線和技術體系初具雛形,亟需產業界上下游聯合推 進,以在算力度量、算力標識、算力感知、算力路由、 算力調度、算力交易等技術方向實現突破。本文將從工 業算力網絡架構面臨的挑戰和其中的關鍵技術等方面進 行逐一介紹。
2 工業算力網絡架構
工業算力網絡以工業互聯網為基礎,通過算力網絡 進行資源配給實現工業互聯網的升級。從邏輯功能上工 業算力網絡可以劃分為工業設備接入層、算力網絡資源 層、算力網絡控制層和算力網絡應用服務層,如圖1所 示。
其中工業設備接入層包括各種工業現場設備,對算 力和網絡需求較高,同時也進行算力執行。工業算力網 絡資源層包括由算力和網絡基礎設施構成的算力及網絡 資源。算力網絡控制層對資源層中的異構算力資源進行 統一度量建模,并匯聚算力網絡資源信息,同時對用戶 業務需求進行分析解構和標識,隨后根據業務需求對全 網資源進行協同調度,實現服務靈活動態部署,為用戶 業務選擇合適的轉發路徑及算力節點。工業算力網絡應 用服務層包含算力交易平臺及為用戶提供各類應用服務 的可編程接口,用戶經由工業算力服務層向算力交易平臺發起算力請求達成算力交易,調用可編程接口進行資 源調用完成應用服務。
如利用卷積神經網絡等方式對產品圖像進行處理來 實現劃痕識別等質量檢測,當設備產生算力需求時,向 算力交易平臺發起算力請求達成算力交易,并調用應用 服務接口將業務信息傳遞到控制層完成對業務的度量、 解構和算力網絡資源的調度,將業務數據經合適路徑路 由至算力執行層中的合適節點進行處理,最終返回處理 結果完成算力請求。
圖1 工業算力網絡架構
3 工業算力網絡面臨的挑戰
由于工業任務需要滿足大帶寬、低時延、低抖動、 高可靠性、高安全性的特殊需求[1],以及工業網絡帶來 的內外網割裂、生產設備類型及數量繁多、工業鏈條 長、數據量大的特性[2],使得使用算力網絡對工業互聯 網賦能存在諸多限制。
3.1 算力度量與標識挑戰
實現算力與網絡的深度融合的前提是對算力網絡中 的算力資源與網絡資源進行統一的度量和標識,以便進 行后續資源的關聯與分配。
在工業算力網絡中,不同設備搭載的芯片以及工廠 內外網所使用的異構算力資源如CPU、GPU、FPGA、 TPU和ASIC等不同類型的硬件差異性大,需要進行性 能上的統一度量。對于度量不同的運算類型,如邏輯運 算、并行計算、神經網絡計算,同一硬件的運算能力也 難以統一。而且在算網融合場景中,算力的度量還與服 務節點的通信能力與服務能力息息相關。因此,如何將網絡、計算、存儲資源與服務共同聯合建模,是工業算 網度量體系面臨的一大挑戰。
針對專業性高、差異性大的工廠內智能任務,對算 力資源與網絡資源進行統一且可驗證的標識可為算力調 度提供基礎。工業外網中算力的流通依賴于對不同數據 中心算力標識的統一,且工業計算任務的保密性高,對 于算網中存在的大量個人算力資源,亟需統一的標識實 現算力的可信鑒權與溯源。
3.2 算力感知挑戰
算力感知是對算力網絡中計算資源的位置、總量、 使用量等狀態信息和算力業務需求的實時感知,是解決多 算力節點協同問題、計算任務與節點匹配問題的基礎。
在基礎網絡中,感知主要集中在通信網絡的環境 變化,粒度差異小。而在工業算力網絡中,不同類型算 力,如硬件資源與服務資源,二者的狀態變更頻率差異 巨大,缺少具有針對性的算力感知機制。現有的算力感 知技術缺少預測機制,面對多變、突發的海量工業任務 需求,難以為實時感知算網中計算資源與網絡資源的狀 態提供技術支撐。而且目前算網中仍存在大量尚待發掘 的算力資源,需設計對應的算力發現技術與算力全網通 告技術為算力感知提供信息基礎。
3.3 算力路由挑戰
算力路由是算力網絡的核心,它負責根據業務的需 求,將其調度至最佳的節點進行處理,為用戶提供高效 的服務。傳統網絡路由僅根據網絡狀態信息進行調度, 而算力路由實現的是網絡、存儲、計算的共同調度。
工業算網中算力資源分布于工廠內網和外網,目前 尚缺少工業內外網多層次算網節點的路由方案。SRv6 源路由技術依靠可編程性與兼容性,已在IPv6網絡中廣 泛使用,如何使其滿足工業算力網絡的需求,是對工業 算力路由提出的新挑戰。
部分要求實時處理工業任務對算網路由的實時性提 出了挑戰,有些短時工業任務導致算力網絡中的狀態信 息變化很快,如何平衡路由的準確性與其對狀態信息的 變化敏感度也是一大難題。隨著算力網絡規模增大,各 部分網絡的環境、狀態不同,網絡波動、堵塞等問題難 以避免,這對工業算網中算力路由的穩定性無疑也是一 個挑戰。
3.4 算力調度與資源分配挑戰
當使用算力網絡對工業互聯網進行賦能時,算力資源對用戶側的呈現形式由端到端變成了泛在部署[2], 這使得在為用戶業務進行算力調度和資源分配時,會面 臨更多的可變性和不確定性,即不同位置的資源由于到 用戶的距離不同、網絡連接好壞不同、各節點的報價不 同、計算、存儲等多維資源的配比不同等而變得不再平 等。
此外,由于工業互聯網場景下的業務需求彈性較 大,當業務需求激增,泛在部署的單點算力資源不能滿 足激增的業務需求,這意味著需要將用戶業務需求進行 劃分,調度至多個算力節點進行處理。
如何根據不同用戶業務的需求,選擇合適的算力節 點和調度路徑,實現用戶體驗的一致性和算力資源的統 一編排及高效利用變得更加復雜。
3.5 算力交易與安全問題挑戰
當用戶與算力節點進行算力交易時,最為關注的則 是定價的合理性和隱私數據的安全性。算力交易雙方往 往由于所處算力級別或所屬算力網絡不同,而具有不同 的定價規則,且相互間業務的適配性出現差異[3],這使 得定價的合理性很難得到雙方的一致肯定,交易就很難 達成。
另一方面的安全性,則是由于業務數據中包含的大 量敏感的隱私數據,或算力請求者和提供服務的算力節 點歸屬不同,使得算力請求者對業務數據有保密需求, 而數據在進行傳輸過程中存在被攻擊的風險,如遭受竊 聽,因此算力網絡能否解決數據的安全問題是算力交易 能否順利達成的另一重要因素。
4 工業場景中算力網絡的關鍵技術
4.1 算力度量、算力標識與算力感知技術
對算力規模不同及類型異構的算力節點,可以采用 度量函數將異構算力歸一化映射為浮點運算能力,并選 取合理閾值將算力劃分為不同等級[4]。為了方便與用戶 需求進行匹配,可以同樣采用浮點運算次數對用戶業務 算力使用量進行度量[5]。此外,工業應用需求一種或多 種特定運算能力,這意味著不同異構算力節點擅長不同 業務,可以采用人工智能算法根據算力節點的異構算力 組成,對算力類型進行隸屬度估計[5],以將算力節點與 其擅長的用戶業務進行匹配。
利用以上算力度量結果,結合算力節點的計算、通 信屬性,以及算力服務多樣性,可以構成對算力資源的 唯一可擴展標識[6],用于對整網算力節點的管理和對用 戶需求的初步匹配。
完成了對算力資源的抽象表示,還需要構建全 網算力資源的感知圖模型,以進行資源的統一編排管 理。根據信息收集的方式可以將感知分為:分布式層 次化感知[3]和結合SDN技術的集中式感知[5,7]。由于集 中式方案的安全性及可擴展性較差,可以采用分布式 方案。在分布式層次化感知中,如圖2所示,算力節 點根據算力度量值劃分的算力等級進行多層次自治組 網,并將算力信息在各級自組織網內進行全網通告, 確保算力信息的實時更新;各級算力關鍵路由將算力 信息進行匯聚,并共同維護一張算力信息更新度最大 化的層次化算力網絡感知圖。
圖2 分布式層次化算力感知
4.2 算力網絡確定性傳輸技術
為了滿足工業智能應用或控制類應用的確定性、 可靠性需求,需要在工業算力網絡中使用確定性傳輸技 術。確定性傳輸技術可以實現在一定界限內的時延、帶 寬、抖動、丟失率、可靠性要求下的傳輸,是一種保障 業務流端到端傳輸時延相關服務質量的技術。
在算力資源及負載信息實時感知的基礎上,將時 間敏感網絡(Time Sensitive Network, TSN)引入到 工業算力網絡中[8,9]。當用戶的業務需求從入口路由進 入網絡時,首先對業務流進行優先級劃分及確定性需求 識別,隨后將業務封裝為報文。在最高級別關鍵路由節 點匯聚全網業務流的報文摘要,并按優先級分別進行排 隊,為各優先級的隊列設置門控,結合時間流表和帶有 一定輸出策略的輸出選擇器,將任務流轉發控制信息在網絡進行廣播,實現業務流的確定性實時傳輸。
4.3 算力解構、算力路由及資源調度技術
工業場景計算任務往往要求實時處理,對算力網 絡的時延和計算性能提出了挑戰,現有的單個算力設備 計算能力有限,難以縮短工業計算任務的處理時延。對 此,將算力需求解構并基于算力路由技術調度多算力資 源并行處理成為了未來工業計算任務的解決方案。
對于復雜的算力需求,如圖3所示,可引入圖聚類 方法將需求解構為多個“子需求”[10],對算網中依賴 與需求關系進行距離量化,并通過聚簇細分實現需求的 分解。算力路由技術可為子需求尋找最優節點與網絡轉 發路徑[11],SRv6動態路由優化技術通過功能增強與擴 展后,可滿足動態多實例的算力路由需求。此外,基于 Floyd算法的資源調度技術[12],通過對算力網絡多源點 加權圖的分析完成資源調度,為實現協同多個算力終端 節點并行處理任務提供了保障。
圖3 算力解構、路由及資源調度
4.4 算力網絡資源定價問題研究
由于工業算力網絡的內外網資源分屬不同的提供 商,因此當工業智能任務需要算力資源的處理時,一個 完備的算力網絡資源交易和定價的體系是必不可缺的。
在工業場景下的算力網絡中,智能計算任務往往 對網絡有著不同的時延需求。與邊緣定價問題相比, 通信、算力等因素相互影響的多資源定價問題亟需解 決。網絡中存在的通信干擾,會導致傳輸時延和功耗的 增加;網路中的排隊等待時間也會增加計算任務處理 時延。對此,可考慮引入廣泛用于資源定價的博弈論方 法[13,14],聯合算力需求與網絡需求建模,構建服務提供 方與購買方的博弈模型并進行求解,同時實現智能設備 的最大化效用與算力服務商的最大化收益。為了保證算 力交易過程的安全性,可引入智能合約技術為交易過程 中的數據提供隱私保護,最終實現可信環境下的算力交 易。算力網絡資源定價如圖4所示。
圖4 算力網絡資源定價
4.5 多終端協同的數據壓縮技術
為了在算力網絡中實現有效的數據傳輸,充分利用 算力網絡中各個節點的有效算力資源,基于信息論、編 解碼理論、學習理論有效地壓縮海量環境數據,將是算 力網絡中的一項關鍵技術研究。
隨著深度學習理論研究的快速發展,其在數據壓 縮領域的優勢也逐漸凸顯。隨機神經網絡、卷積神經網 絡、遞歸神經網絡、生成對抗網絡、變分自動編碼器等 陸續被應用到數據壓縮技術之中,利用深度學習模型的 非線性映射能力,可以快速學習到海量數據的深層次特 征,更加有效地去除掉冗余數據特征,進而滿足海量數 據壓縮的需求,實現算力網絡節點之間海量數據的低時 延傳輸。
4.6 數字孿生算力網絡自優化技術
數字孿生技術是指利用數字化技術,為真實的物理 實體創建對應的虛擬模型并模擬其行為,從而擴展與優 化物理實體的功能。數字孿生技術目前已被引入網絡的 運維、管理、優化中[15-17],通過構建可實時交互映射的 網絡虛擬孿生體,最終實現對實體網絡的優化管理。
在工業算力網絡的場景下,可通過數字孿生技術與 空間物理系統的結合,完成虛擬孿生體的創建。面對網 絡中節點超時的情況,算力網絡提供超時節點與網絡狀 態信息的實時采集,并調用孿生模塊中的算法進行網絡 優化與驗證,最終實現工業算力網絡的自優化與運行管理,從而提升算力網絡的運行效率并降低運維的人工成 本。數字孿生算網自優化及管理如圖5所示。
圖5 數字孿生算網自優化及管理
5 結束語
工業互聯網在向數字化、智能化方向發展的過程 中,對算力的高效利用提出了更高的要求,這促使工業 互聯網與算力網絡進行深度融合。本文在工業算力網絡 研究的初始階段,對其架構及運作思路、面臨的挑戰和 實現所需的關鍵技術進行了總結和構想,為相關研究人 員提供了參考。
作者簡介:
許士勛(1999-),男,碩士,現就讀于北京郵電大 學,主要研究方向為算力網絡、工業互聯網。
張 奧(1999-),男,碩士,現就讀于北京郵電大 學,主要研究方向為算力網絡、工業互聯網。
宋聞萱(1998-),女,碩士,現就讀于北京郵電大 學,主要研究方向為算力網絡、工業互聯網。
黃瀟潔(1999-),女,碩士,現就讀于北京郵電大 學,主要研究方向為算力網絡、工業互聯網。
許方敏(1982-),男,副教授,博士,現就職于北 京郵電大學,主要研究方向為物聯網網絡、未來網絡 技術。
趙成林(1964-),男,教授,博士,現就職于北京郵 電大學,主要研究方向為短距無線傳輸技術、認知無線 電技術、毫米波技術、工業互聯網網絡。
參考文獻:
[1] 邊緣計算產業聯盟, 工業互聯網產業聯盟, 網絡5.0產業和技術創新聯盟. 5G時代工業互聯網邊緣計算網絡白皮書[R], 2021.
[2] 唐靜, 解云鵬, 雷波, 趙倩穎. 工業互聯網場景下邊緣計算的關鍵技術探討[J]. 自動化博覽, 2022, 39 (2) : 34 - 37.
[3] 中國移動通信集團終端有限公司, 北京郵電大學, 中國通信學會. 端側算力網絡白皮書[R], 2022.
[4] 李建飛, 曹暢, 李奧, 等. 算力網絡中面向業務體驗的算力建模[J]. 中興通訊技術, 2020, 26 (5): 6.
[5] 郭鳳仙, 孫耀華, 彭木根. 6G算力網絡: 體系架構與關鍵技術[J/OL]. 無線電通信技術, 2023: 1-10. http://kns.cnki.net/kcms/ detail/13.1099.TN.20230104.1235.007.html.
[6] 周舸帆, 雷波. 算力網絡中基于算力標識的算力服務需求匹配[J]. 數據與計算發展前沿, 2022, 4 (6) : 20 - 28.
[7] 劉鵬, 李志強, 陸璐. 面向工業互聯網的算力網絡思考[J]. 自動化博覽, 2022, 39 (2) : 25 - 28.
[8] 賈慶民, 胡玉姣, 張華宇, 彭開來, 陳平平, 謝人超, 黃韜. 確定性算力網絡研究[J]. 通信學報, 2022, 43 (10) : 55 - 64.
[9] 李宗輝, 楊思琪, 喻敬海, 鄧仰東, 萬海. 時間敏感網絡中確定性傳輸技術綜述[J]. 軟件學報, 2022, 33 (11): 4334 - 4355.
[10] 魏華, 張婷婷, 李瑩. 算力網絡一體化服務架構與實踐[J]. 通信世界, 2022 (16) : 39 - 42.
[11] 黃光平, 史偉強, 譚斌. 基于SRv6的算力網絡資源和服務編排調度[J]. 中興通訊技術, 2021, 27 (03) : 23 - 28.
[12] 孫鈺坤, 張興, 雷波. 邊緣算力網絡中智能算力感知路由分配策略研究[J]. 無線電通信技術, 2022, 48 (01) : 60 - 67.
[13] 吳雨芯, 蔡婷, 張大斌. 移動邊緣計算中基于Stackelberg博弈的算力交易與定價[J]. 計算機應用, 2020, 40 (09) : 2683 - 2690.
[14] 廖皓琳. 面向QoS按需的多用戶Stackelberg博弈與網絡資源定價研究[D]. 華南理工大學, 2021.
[15] 王達, 孫滔, 孫曉文, 郭建超, 孫杰, 陳果, 楊愛東, 歐陽曄. 數字孿生在網絡全生命周期管理中的研究[J]. 電信科學, 2022, 38 (04) : 138 - 145.
[16] 劉偉軒, 劉曉蓮. 基于數字孿生技術的網絡運維管理系統架構研究[J]. 信息與電腦 (理論版), 2021, 33 (07) : 16 - 18.
[17] 王奇奇, 莫皓穎, 戶江民, 牟明銘. 基于數字孿生的網絡優化方法研究[J]. 電聲技術, 2021, 45 (01) : 52 - 54.
摘自《自動化博覽》2023年第2期暨《邊緣計算2023專輯》