理解提問,快速給出回答;訓練聲音,翻唱經典歌曲;根據描述,繪出趣味畫作……近期,基于大模型研發的生成式人工智能,展示了在語言理解和內容生成等方面的出色能力,引發社會關注。
大模型賦能,生成式人工智能正在引發新一輪智能化浪潮。得益于擁有龐大的數據、參數以及較好的學習能力,大模型增強了人工智能的通用性。從與人順暢聊天到寫合同、劇本,從檢測程序安全漏洞到輔助創作游戲甚至電影……生成式人工智能本領加速進化。隨著技術迭代,更高效、更“聰明”的大模型將滲透到越來越多的領域,有望成為人工智能技術及應用的新基座,變成人們生產生活的基礎性工具,進而帶來經濟社會發展和產業的深刻變革。人工智能大模型強大的創新潛能,使其成為全球競爭的焦點之一。
經過多方努力,我國人工智能大模型已具有一定基礎。在2023中關村論壇上發布的《中國人工智能大模型地圖研究報告》顯示,中國人工智能大模型正呈現蓬勃發展態勢。據不完全統計,截至目前,10億級參數規模以上的大模型全國已發布了79個。我國在大模型方面已建立起涵蓋理論方法和軟硬件技術的體系化研發能力。也應看到,人工智能大模型離不開多項技術的融合創新。在前沿基礎理論和算法上,我國與國際先進水平還存在差距。筑牢智能時代的根基,需要瞄準短板,著力推動大模型領域生成式算法、框架等原創性技術突破。同時,還應發揮我國應用場景優勢,進一步深耕垂直領域,以行業專有訓練數據集為基礎,打造金融、醫療、電力等領域的專業大模型。要以高質量應用和數據反饋技術優化,幫助大模型迭代升級。
數據質量影響大模型“智商”。國際上一些大模型之所以領先,與大量公開高質量數據的訓練息息相關。我國有海量數據和豐富應用場景,應逐步開放共享優質數據,通過制定共享目錄和共享規則等方式,推動數據分級分類有序開放,讓流動數據激發創新活力。例如,前不久印發的《深圳市加快推動人工智能高質量發展高水平應用行動方案(2023—2024年)》提出,“建立多模態公共數據集,打造高質量中文語料數據”。期待各地各行業從實際出發,加強高質量數據供給,為大模型成長提供充足“養料”。
人工智能大模型研發周期長、投入大、風險高。經過數年持續研發,國際領先的大模型聚集了較好的資源和人才。當前,我國不少高校院所、企業正在做研發工作,在大模型、大數據、大算力等方面各有側重,研發力量較為分散。作為追趕者,有必要進一步強化企業科技創新主體地位,整合優勢創新資源,推動形成大模型產學研攻堅合力。
人工智能大模型帶來的治理挑戰也不容忽視。營造良好創新生態,需做好前瞻研究,建立健全保障人工智能健康發展的法律法規、制度體系、倫理道德。為促進生成式人工智能技術健康發展和規范應用,今年4月,國家互聯網信息辦公室發布《生成式人工智能服務管理辦法(征求意見稿)》。新技術應用往往先于規范。著眼未來,在重視防范風險的同時,也應同步建立容錯、糾錯機制,努力實現規范與發展的動態平衡。
人工智能是新一輪科技革命和產業變革的重要驅動力量,加快發展新一代人工智能是事關我國能否抓住新一輪科技革命和產業變革機遇的戰略問題。從戰略高度著手,凝聚合力、攻堅克難、勇于創新,努力拓展理論和技術應用空間,必能更好培育壯大新動能,構筑發展新優勢。
來源:《人民日報》