讓機器像人一樣思考,是很多人工智能(AI)從業者的美好愿景,也是不少投資人看好的賽道。
今年9月,由清華大學知識工程實驗室(KEG)孵化的人工智能企業智譜AI宣布獲得數億元人民幣B輪融資。本次融資由君聯資本和啟明創投聯合領投,將被用來繼續投入打造高性能千億級普惠大模型。
啟明創投合伙人周志峰表示:“下一個十年,人工智能將走向認知智能。預訓練大模型是其核心技術推動力和關鍵基礎設施,讓AI吸收更多的知識去理解和思考,最終實現接近人類水平的認知。同時,預訓練大模型使得AI從依賴手工調參建模走向可大規模復制的工業化階段。”
最近,人工智能公司OpenAI發布的AI聊天機器人ChatGPT成功“破圈”,它可以按照要求寫詩、寫新聞稿甚至生成代碼,使得大模型的創新熱潮備受關注。這一賽道上的智譜AI也再次走進了“聚光燈”下。
打造國產開源大模型
2020年6月,人工智能公司OpenAI發布了GPT-3語言模型,其千億參數的規模和強大的語言處理能力攪動了AI領域的“一池春水”。今年年初,OpenAI將GPT-3微調為InstructGPT ,減少了不真實、有偏差的輸入。如今,OpenAI又將其進一步升級為ChatGPT,并在線上測試中展現出驚人的語言能力。
遺憾的是,GPT-3 的模型參數不開源,僅以付費API(應用程序編程接口)的形式提供給海外用戶(中國地區不可用),這給研究者對模型的深入探索設立了壁壘。
當前,雖然互聯網公司Meta開源了大模型OPT,AI創業公司Hugging Face開源了BLOOM,但用戶至少需要一臺 A100(80G×8)服務器才能啟動推理,大部分普通研究者仍然被擋在門檻之外。
與此相對的是,今年8月,由KEG與智譜AI共同研發的大規模中英文預訓練語言模型GLM-130B正式發布,該模型以開源開放的形式供研究機構或個人免費下載使用。團隊在模型量化方面做了大量嘗試,用戶可以在一臺 A100(40G×8)或V100(32G×8)服務器上進行推理。
不久前,美國斯坦福大學基礎模型研究中心負責人Percy Liang等開展了一項研究,對國際上眾多大模型進行對比,其中GLM-130B模型在魯棒性和正確率方面均取得了較好的表現,且該評測僅使用英文任務,GLM-130B可同時支持中英雙語。
從2021年12月起,清華大學KEG、PACMAN(并行與分布式計算機系統)、NLP(自然語言處理)等實驗室開始了關于訓練千億參數的稠密模型的討論。隨著工作的推進,研究團隊一直沒有找到充足、穩定的計算資源用于模型訓練。
今年4月,在了解到清華大學KEG的千億參數GLM模型訓練缺少計算資源的情況后,智譜AI決定為這一項目免費提供模型訓練所需的算力支持。
經過多方的協調與努力,智譜AI最終租用了近百臺A100服務器,為KEG提供了模型訓練所需的算力,并致力于將這一研究開源、開放,讓研究界和產業界都能以超低成本理解大模型和使用大模型。
“如此規模的算力、以月為單位的租用,其成本對于創業公司來說不是筆小數目,但公司還是毅然決定為項目提供支持。”智譜AI總裁王紹蘭表示,“我們希望通過這樣的方式,讓更多人直接用上大模型,帶動更多人了解和認可大模型。最終,讓大模型技術像云計算、大數據一樣成為信息化、智能化系統的基礎設施,為各行各業賦能。”
大模型賦能的數字人
連日來,第二十二屆世界杯足球賽正在卡塔爾進行,在相關視頻App的世界杯轉播報道中,總會有一個熟悉的身影出現在視頻節目左下角。
她是智譜AI研發的AI手語數字人華同學,可以為觀眾提供專業、準確的手語體育賽事解說,向聽障人群傳遞足球場上的“聲音”。
早在北京冬奧會和冬殘奧會期間,華同學就曾服務于《北京您早》節目,對“冬奧賽事集錦”和“一起看冬奧”進行手語播報。
“用數字人完成手語播報,不僅降低了冬奧運營成本,還彰顯了冬奧的科技創新力。”王紹蘭介紹,智譜AI研發的智慧手語系列產品,涵蓋手語播報、手語翻譯以及手語詞典三種應用,滿足手語信息播報、實時翻譯交流、手語學習等多個場景的需求。
“大規模預訓練模型賦能的數字人,體現了智譜AI的社會公益情懷,讓科技更有溫度。”王紹蘭表示,“以千億級預訓練大模型為核心,我們的數字人已經在AI虛擬面試官、虛擬主持人、智能客服、陪聊機器人等場景得到應用。接下來,我們還將繼續拓展數字人的應用場景,建立數字人生態合作,加快實現‘數智人’。”
《中國科學報》獲悉,智譜AI基于開源的千億雙語預訓練模型GLM,推出了聊天機器人XDAI和chatGLM,讓機器模擬人類的思考模式,實現知識具象化的對話系統。
與此同時,在大模型的技術基礎之上,智譜AI還提出了Model as a Service(MaaS)的市場理念,即提供模型共訓服務、模型授權服務,以及API開放平臺等,聯合上下游伙伴建設大模型生態。
在生態建設方面,智譜AI與中國計算機學會(CCF)聯合發起了CCF-智譜大模型基金,圍繞預訓練大模型理論、算法、模型、應用等相關研究提供資助,希望通過降低大模型研究的門檻,讓每一名計算機領域的科研工作者均有機會參與大模型的研究,推進大模型技術和應用的創新落地。
經歷時間檢驗的初心
沒有一次成功是偶然的,技術走出實驗室并投入市場應用更是如此。
智譜AI成立于2019年,由清華大學KEG的技術成果轉化而來。在智譜AI核心團隊中,首席執行官張鵬畢業于清華大學計算機系,董事長劉德兵是中國工程院院士高文的弟子,王紹蘭則是清華大學創新領軍博士。
早在2006年,清華大學KEG就啟動了科技信息分析引擎ArnetMiner(以下簡稱AMiner)的相關研究,到真正實現產業化,即智譜AI成立的時候已經過去十多年。當年的研究團隊先后獲得了國際頂級會議SIGKDD的十年最佳論文、國家科學進步獎二等獎、北京市發明專利獎一等獎。
“技術要實現產業化還需要做到洞察市場需求、持續創新推廣、賦能產業生態。”王紹蘭回憶,“當時僅僅是為了抓取、清洗數據,我們就在南京專門成立了分公司,共40多人,從一開始的手工標注,到逐漸建立起技術規則,再到將AI算法靈活應用于其中。”
在日復一日的打磨和探索下,如今的AMiner系統收錄了全球1億余位學者、38萬家機構發表的3.3億篇論文、1.1億篇專利、280萬個科研項目,并構建了億級高清知識圖譜,涵蓋40個學科800萬個知識概念和11億條關聯信息,每年吸引全球220個國家/地區的3000多萬獨立IP訪問。
這些年來,從實驗室的技術出發,智譜AI一直保持初心,努力學習。“實現知識與大模型的融合需要產學研強結合,需要打造研究生態、硬件生態、智算生態、應用生態、組織生態。”王紹蘭向《中國科學報》透露,“我們希望通過打造支持不同場景、不同方向的智能應用程序的底層人工智能架構,賦能千行百業,‘讓機器像人一樣思考’將是可以觸及的未來。”
來源:《中國科學報》