★ 上海道客網絡科技有限公司
1 目標和概述
近年來,國家提出“中國制造2025計劃”,期望中國的制造業能從低端制造往高端制造與智能化生產發展,因此各企業爭相利用高科技手段來提升產品質量, 改進產品研發與制造。部分企業嘗試利用IoT+AI技術 來解決生產過程中的質量問題,但目前智能質量缺陷檢 測手段往往存在以下問題:
(1)為了提高AI檢測缺陷的準確率,需要不斷人 工介入提取并標記缺陷特征,而人工審片存在誤檢、漏 檢等問題,且人工處理效率低下,增加了企業人力資源 成本,限制了生產效率及質量提升。
(2)產品檢測基于IoT技術,數據需要傳送到云 端進行推理分析,對網絡時延要求高,工廠現場容易受 到網絡影響,從而導致識別延時較高。
(3)產線檢測設備雖然已經連接了網絡,但更新 模型所需的運維工作量巨大,并且存在現場維護成本較 高、遠程維護網絡限制等問題,無法快速更新訓練模 型,提升檢測效率。
企業亟需一套更為優越的智能缺陷檢測平臺解決方案,滿足以下目標:
(1)先進性:采用先進的架構設計與成熟的開發 框架,支撐企業未來整體架構優化和升級。
(2)靈活性:部署靈活,不強依賴底層硬件環 境,實現異構設備的兼容及復用,幫助企業有效控制成 本。
(3)開放性:通過標準化的開發與設計以及完備 的安全體系,將企業生產數據作為數字資源進行沉淀并 復用,加速企業數字化轉型。
(4)實用性:貼合實際應用場景,幫助企業有效 降低人工成本,提高生產效率 。
道客基于工業互聯網標準層次架構,以人工智能 與邊緣計算技術結合為基礎,研發一套面向工業互聯網 智能工廠質量智能分析的云邊協同智能缺陷檢測平臺, 實現質量缺陷檢測模型一站式開發與運用、提升工作效 率、加速企業智能化數字工廠場景落地,促進智能邊緣 處理技術成果轉化和產品研發與推廣。
業務流程如圖1所示。
圖1 業務流程圖
該方案對比其他以往傳統的智能缺陷檢測系統有三 大改進特點:
(1)基于云原生的邊緣計算資源管理技術。
(2)基于云邊協同的模型訓練及推理的全生命周期 管理技術。
(3)基于云原生的容器化部署及生產力管理技術。
2 方案介紹
2.1 系統架構
此云邊協同智能缺陷檢測平臺的系統架構如圖2所示。
圖2 系統架構圖
以下各軟硬件子系統基于云邊協同,共同完成智能缺陷檢測的業務流程:
(1)終端設備:采集工廠生產數據(圖片、視 頻、時序數據)。
(2)邊緣節點:
· 承擔邊緣算力進行AI推理。通過云邊協同能力,實現邊端數據上傳給云端。
· 通過邊緣管理平臺自動化運維能力,實現將模型以容器化方式自動更新到邊緣端,完成AI推理能力的更新。
(3)AI PaaS平臺:迭代訓練,提高推理模型的識別精度和準確度。
(4)業務云平臺:實現缺陷檢測分析的服務化能力。
2.2 云邊協同平臺功能架構
云邊協同平臺的具體功能架構如圖3所示。
圖3 功能架構圖
該云邊協同平臺主要功能包括:
(1)邊緣節點統一管理:支持批量接入海量的 邊緣節點,兼容X86、ARM32、ARM64等芯片異構硬 件;相同類型的節點通過預安裝證書和配置文件,開機 聯網后即可完成節點的納管,提高節點管理效率并降低 運維成本。
(2)應用全生命周期管理:支持云端以鏡像的方 式將模型、應用下發到邊緣節點;聲明式API配置規則 策略,自動化批量部署應用到邊緣節點;云端統一對應 用進行全生命周期管理、監控和運維。
(3)邊緣設備管理:支持MQTT、Modbus協議 的設備接入;支持通過孿生屬性對設備進行控制;并可 以監控設備運行狀態。
(4)邊緣自治:當應用實例出現異常或節點故障 時,能夠快速將應用實例調度到節點組中其它可用的節 點上運行;即使在節點處于離線狀態時仍然能夠自動調 度,確保應用的自主運行,保障業務的持續性;云邊重 連后,支持邊緣側數據斷點續傳,減輕網絡傳輸壓力。
(5)邊緣智能管理:通過云端AI PaaS平臺進行 迭代訓練,提高推理模型的識別精度和準確度;通過邊 端算力進行AI推理,減少對云邊網絡依賴及云端資源占 用。支持云端監控模型驗證情況,通知用戶進行模型下 發部署、增量更新,減少運維工作量。
(6)數據協同管理:邊緣端采集的工廠設備數據可通過云邊數據通道,自動同步至云端;邊端數據經過數 據路由組件處理后,可轉發到云端或第三方應用,實現 邊端數據共享與開放,實現對各業務場景的決策支撐。
2.3 技術設計方案
(1)數據采集(模塊技術設計如圖4所示)
· 通過定制化設備Mapper,實現端設備與邊緣節 點的控制/數據平面打通。
· 通過邊緣消息組件實現設備與設備、設備與應用 的邊-端的控制/數據協同。
圖4 數據采集設計圖
(2)數據協同(模塊技術設計如圖5所示)
· 通過云邊數據通道,實現云-邊數據協同,將邊端產生的實時數據自動同步云端。
· 通過數據路由組件,對邊端數據在云端共享與開放,實現對各個云端業務場景的決策支撐。
圖5 數據協同設計圖
(3)模型協同(模塊技術設計如圖6所示)
· 對邊端采集的圖片數據實時分析,通過難例算法 評估出需回傳云端數據,減少云端模型標注/訓練的工 作量。
· 通過云端AI任務協調管理,觸發云端訓練任務, 并監控模型驗證情況,通知用戶進行模型的部署管理, 實現模型增量更新,減少人工運維工作量。
圖6 模型協同設計圖
(4)模型部署(模塊技術設計如圖5所示)
· 通過DevOps實現無基礎設施相關性的AI模型部署;
· 通過建立云邊消息通道實現邊緣模型的部署控制;
· 通過建立云邊數據通道實現模型的下載及增量更新。
圖7 模型部署設計圖
(5)數據安全
· 支持云邊雙向TLS加密通信,實現數據加密傳 輸;
· 支持多租戶管理,實現租戶間數據隔離;
· 提供審計日志,保障用戶操作可追溯。
3 代表性及推廣價值
幫助電力行業某大型企業搭建了一套服務于集團內 部的云邊協同智能缺陷檢測平臺,協助企業采集各產線 的生產數據,通過云邊協同技術提升AI模型的精度與準 確度,沉淀出各類高技術含量的數字資產,并向云端其 他應用開放共享,幫助企業提高整體生產效率及生產質 量,實現降本增效。
3.1 企業收益
(1)通過邊緣AI推理,提高評片效率與準確率, 降低企業成本。
(2)極大地減少人工介入,自動審片效率成倍提 高。
(3)根據數據的難例分析,實現模型的云邊協同 訓練,使得模型不斷迭代更新,提高識別精度。
(4)平臺與其他系統互聯互通,實現數據同享、 信息互通,可以根據結論報告進行溯源,實現檢測閉環。
3.2 創新性
(1)基于云原生實現模型DevOps管理:基于云 原生技術支撐模型的標注、訓練、構建、部署全生命周 期流程,提高模型開發效率。
(2)基于云邊協同調度實現模型的自動化AI增量 學習:通過云邊協同框架實現數據自動化上傳,從而實 現模型的自動化增量訓練學習,減少AI模型開發工作 量。
(3)通過邊緣應用容器化改造降低AI運行環境運 維難度:在邊緣端使用容器封裝技術,將AI模型依賴運 行時庫封裝到獨立環境中,減少每次模型更新部署的運 維難度。
(4)通過邊緣容器管理引擎實現邊端應用的高可 用:使用邊緣資源管理引擎,實現邊緣應用高可用及離 線自治能力,從而減少邊端業務故障發生概率。
3.3 方案價值
(1)推動技術或商業模式創新
依托云原生技術體系,將企業數字化基礎設施下沉 至生產活動現場,圍繞邊緣節點自治、應用&模型一體 化管理以及生產活動數據對接三個核心維度,加強云邊-端的聯系,消除技術棧的不一致性。
(2)賦能產業高質量發展
在工業視覺、工業AI檢測等業務場景中,能夠為 這些客戶提供與云端技術棧保持一致的邊緣數字化基礎 設施,提高云邊協同的效率,并且降低運維管理成本。 將數據處理、業務應用、AI模型等下沉到邊緣端執行, 解決物聯網落地時響應實時性、數據隱私性、維護便利 性等問題,從而滿足行業數字化在敏捷聯接、實時業 務、數據優化、應用智能、安全與隱私保護等方面的關 鍵需求。
摘自《自動化博覽》2023年第2期暨《邊緣計算2023專輯》