生成式AI大模型并未改變,人工智能在工業領域應用的范式
以ChatGPT、Llama等為代表的大模型技術拉開了邁向通用人工智能的序幕,人工智能成為全球經濟增長的重要驅動力(2.720, -0.04, -1.45%),對各類產業的智能化帶來全新的空間。根據普華永道的預測,到2030 年,人工智能可為全球經濟貢獻高達 15.7 萬億美元,超過中國和印度目前的產出總和。其中,6.6 萬億美元可能來自生產率的提高,9.1 萬億美元可能來自消費端的影響。對于制造業,人工智能一直是智能制造、工業4.0、工業互聯網等領域的重要部分,在ChatGPT、Stable Diffusion等崛起前,質量檢測、設備預測性維護等代表性的人工智能應用已經深度融入制造業,并且形成成熟的應用范式。
工業人工智能的應用范式已經成型 ,一是需要深度學習、強化學習等數據科學算法,計算機視覺、自然語言處理、語音識別等面向領域的算法,知識圖譜、專家系統等知識工程,例如通過計算機視覺來構建產品外觀檢測的模型,基于強化學習進行排產規劃模型的構建,借助知識圖譜構建設備運維服務。二是需要通用支撐技術保障人工智能應用在制造業的部署和推理,例如邊緣計算、高性能計算等技術保障現場的推理速度,時序數據庫、大數據平臺等保障數據的有效管理和接入。三是需要工業領域知識及經驗實現人工智能應用與工業場景的適配,例如在模型訓練的時候需要專家經驗的介入實現調優和優化,在部分場景下需要機理模型和人工智能模型的結合才能發揮作用,在生產現場模型的部署和實施也需要和自動化的設備、工業軟件等進行集成。
大模型的崛起并沒有對人工智能在制造業的應用范式引起根本性的變革,但是在不同的環節增添了特定的需求,例如在算法層面,基于Transformer、U-Net 等架構的基礎模型成為生成式人工智能進入制造領域的基礎;在通用支撐技術領域,向量數據庫、MaaS等也成為重要的數字基礎設施;在工業知識及經驗領域,不同以往對時間序列等結構化數據的需求,生成式AI對高質量文本、圖片、文檔等數據的要求不斷提升。雖然大模型仍在原有的范式下進行應用,但是大模型技術會不斷的拓展人工智能在工業領域應用的空間,根據埃森哲測算,Al可以在2035年將制造業的附加值提高近4萬億美元,根據Marketresearch預測,到 2032年,全球生成式人工智能制造市場規模將達到63.98億美元。
生成式AI大模型短期趨勢:拓展新場景并未出現替代小模型
生成式AI大模型能力覆蓋結構化數據、文本、圖像、音視頻等多個領域生成,但在制造業領域的探索仍聚焦于結構化數據、自然語言和圖像數據的處理和生成。這種情況的形成主要是目前尚未出現能力較強的音頻、視頻領域的基礎模型,所以尚未出現小模型領域像基于聲紋分析的設備診斷、基于視頻分析的安全生產等相關的工業案例。生成式AI探索也覆蓋了制造業的研發設計與規劃、生產過程管控、經營管理優化、產品服務優化等全生命周期。
在研發設計與規劃階段, 一方面是利用自然語言的交互能力實現CAD軟件功能的拓展,例如Back2CAD 基于Elaine CAD Bot、ChatGPT 和 Amazon AWS等的支持推出CADGPT?,支持智能推薦、文檔生成、代碼生產等各類功能。另一方面是基于圖像數據的生成能力提升設計效率,例如海爾設計基于亞馬遜云科技和合作伙伴 Nolibox 攜手打造的 AIGC 解決方案,將AIGC 圖像生成能力引入到產品設計、UI 設計、CMF 設計、品牌設計等環節,涵蓋了新品設計、改款升級、渠道定制化等工業設計的業務場景。
在生產制造環節, 圍繞知識問答和代碼生成等能力成為重要的探索熱點。例如西門子和微軟還在合作開發可編程邏輯控制器 (PLC) 的代碼生成工具,ChatGPT 被用于通過自然語言輸入生成 PLC 代碼。Authentise通過利用12,000 篇科學增材制造論文對通用大語言模型的精調,推出 3DGPT用于增材制造技術問答。用戶可以獲得例如“在使用粉末不銹鋼時如何減少缺陷的可能性”等專業問題答案。例如創新奇智推出AInno-15B工業大模型,通過大模型服務引擎支撐生成式AI應用,實現工業機器人(11.460, -0.29, -2.47%)控制、企業私域數據分析、企業私域知識庫等應用。SprutCAM X結合ChatGPT api 構建CAM虛擬助手,能夠支持工程師操作機床加工,例如提出在點(100, 25)處鉆一個直徑10毫米的孔”,AI助手就會為生成相應的CAM執行代碼。C3iot 也是基于大語言模型構建了面向多個行業和多個領域的生成式AI 服務,并且為某大型制造企業基于生成式AI提供設備運維服務,借助 C3 Generative AI,操作員可以利用簡化的工作流程來診斷設備故障根因。當操作員發現生產問題時,可以直接進入 C3 Generative AI 搜索故障排除指南和教科書,以找出潛在原因。
在經營管理環節, 基于大語言模型新增智能問答、數據分析等能力成為主流。例如在ERP領域,用友以ChatGPT、文心一言、Llama等大模型為底座構建yongpt,在大模型的基礎架構當中,把確定性的事項交回用友BIP原有的產品功能去做,把不確定的事項、推理性的事項和人腦思維意識派定的事項交給大模型去開發,能夠支撐企業經營洞察、智能訂單生成、供應商風控、動態庫存優化等應用。在CRM 領域,Salesforce、微軟等均加強生成式AI在產品中的集成和應用。
在產品服務優化環節, 將大模型的能力集成到產品中,成為消費電子、汽車等領域產品智能化能力提升的探索焦點。例如國光電器(16.010, 0.43, 2.76%)推出的智能音箱Vifa ChatMini 內置了ChatGPT和 文心一言雙模型,在保持了專業聲學標準的基礎上,與傳統的智能音箱相比,Vifa ChatMini 在自然語言生成和情感表達方面具有顯著的優勢,可應用到老年人和兒童等特定用戶群體,用于情感支持和智能學習陪伴,也可作為智能助手應用在日常工作和規劃中。
綜上,目前生成式AI大模型在制造業的探索路徑初步呈現為三條路徑:
一是通過直接集成基礎大模型的問答、代碼生成等通用能力來提升效率。例如海爾、西門子等的CAD、PLC代碼生成;Salesforce、微軟、ABB、用友等在CRM、ERP、生產管理等軟件接入大模型,提升專業軟件的數據分析、文檔管理、知識問答等輔助能力。
二是通過微調、外掛知識庫等方式來聚焦領域實現場景創新,增加新的功能。例如,Authentise通過利用12,000篇科學增材制造論文的精調對通用大語言模型的精調,推出 3DGPT用于增材制造技術問答。
三是從預訓練開始構建工業大模型。 例如創新奇智工業大模型AInno-15B從 Llama 2、Falcon、Bloom等開源大模型中蒸餾一部分知識,再結合自己設計的參數結構和積累的工業知識數據做訓練。經過Pretrain、SFT和RLHF三個訓練步驟,依次使模型獲得更懂工業、支持問答交互和答案更標準的能力。
生成式AI大模型,在制造業領域仍需克服三大挑戰
人工智能在工業領域的應用仍具備非常廣闊的空間,根據凱捷統計,只有歐洲頂級制造企業AI 應用普及率超過30%,日本制造企業AI 應用率達到30%;美國制造企業AI 應用率達到28%;中國制造企業普及率達到11%,這個調查表明人工智能在工業領域的普及率仍有很高的空間。但是生成式AI大模型的應用仍需面臨一些挑戰:
一是尚未出現投入產出比非常明確的場景。 在ChatGPT爆發之前,人工智能雖然在制造業擁有很多場景的探索,但是較為認可的領域仍然聚焦于的質量檢測和設備預測性維護,這兩種場景被認可的核心原因就是在項目實施后的效果較為明顯,例如產品表面缺陷檢測能夠同過人力成本的節省來計算明確的ROI,設備預測性維護能夠基于設備故障發現的時間節點來衡量效果,但是在生成式AI的應用,尚未出現類似以上兩種經濟效應較為明顯的場景,大多數場景的探索處于試點和探索階段。
二是面向領域的基礎模型缺乏。目前面向工業領域大模型的做法,大多都是從精調做起,并沒有經過預訓練階段,而預訓練才是真正知識灌輸階段,讓模型真正學習領域數據知識,做到適配領域。從精調做起或者直接集成大模型只是激發原有大模型的能力,并沒有從實現對領域知識的理解和推理。而當前的基礎模型發展仍處于通用大模型競爭的白熱化階段,對面向行業的基礎模型關注較少,目前也僅有少數的企業開始從預訓練階段構建制造業領域的生成式大模型應用。
三是制造業領域場景高度碎片化。碎片化的場景對大模型這種對數據、算力要求較高的范式也提出了挑戰。工業數字化領域經常流傳一個邏輯,“工業數字化是萬億級的市場,但其是一萬個億級市場的組合”,對于細分領域來說,很難有足夠多可用的數據來從預訓練階段開始訓練大模型,通用的大模型又無法適配聚焦細分領域的場景需求,這種天然的矛盾會阻礙大模型的發展。
備注:斯坦福大學用基礎模型來泛指通過自監督學習在超大規模數據上訓練并且可以適配(例如,微調)各種下游任務的模型,這些模型包含但不限于ChatGPT、Llama等。在我國伴隨著產業發展,通常用大模型來泛指ChatGPT、Llama等生成式模型,本文撰寫過程中對語言、圖像、多模態等各類生成式AI沿用了目前我國產業界形成的共識。
來源:《騰訊研究院》