美國公司OpenAI推出的人工智能聊天機器人ChatGPT“火”出圈了,上線兩個月就收獲了1億月活用戶,成為歷史上增長最快的消費級應用程序。這個速度打破了此前由字節跳動旗下短視頻社交平臺TikTok創造的9個月收獲過億月活用戶的紀錄。
這款“現象級”產品背后預示著什么樣的未來?中國有開發類似產品的基礎嗎?
競爭已至
在社交平臺展示自己與ChatGPT的對話截圖,已經成為一種時尚。它可以用自然語言和人類用戶對話,理解用戶意圖,完成寫論文、寫代碼等各種內容生成任務;還可以展現“學霸”光環,在沃頓商學院通過了MBA考試、在明尼蘇達大學通過了法學院考試……
“ChatGPT是人工智能領域的又一次革新,將會推動新一輪的AI(人工智能)模型競爭。”遠鑒信息技術有限公司首席技術官鄭榕認為,ChatGPT的最大貢獻在于基本實現了理想型語言預訓練模型的接口層,讓機器人學習適應人類的表達方式,而不是反過來讓人類學習可以命令機器的指令,這是一種更符合人類表達習慣的人機接口技術。
ChatGPT的火爆對產業界、學術界都帶來了巨大的沖擊。
“2016年以來,我國人工智能產業規模呈現迅猛增長態勢,但2019年我國人工智能投融資出現大幅度下跌。”賽迪顧問股份有限公司副總裁宋宇認為,總體來看,人工智能發展退潮主要還是缺乏支撐產業快速發展的技術突破,而ChatGPT的出現恰好給行業發展和投資帶來了新動力。
高科技投資機構方舟投資發布報告預測,到2030年,AI將大幅提高知識工作者的工作效率,平均工作效率增加140%?!靶乱淮斯ぶ悄芗夹g將有可能大幅度降低腦力勞動者的工作強度。如果這一切成為現實,或將是繼人類歷史上由于動力革命而擺脫繁重的體力勞動之后,人類社會發生的又一次深刻的技術革命。”阿里研究院資深技術專家、中國計算機學會人工智能專委會常務委員蘇中在近日發布的文章中表示。
“ChatGPT更偏向于對話機制的巨大優勢,對包括谷歌在內的傳統搜索引擎而言是巨大的挑戰。它的火爆將大大推動OpenAI主導的大規模語言模型研究方向的發展。隨著企業多模態領域的布局,人工智能相關領域會有突破性的進展。”北京航空航天大學人工智能研究院副研究員胡堃說,由于ChatGPT對算力要求較高,對于計算資源有限的高校而言,加大了學術研究的困難,亟需打通企業資源,加強產學研合作。
抓緊布局
在ChatGPT帶來的這波AI競爭中,中國顯然不甘人后。2月13日北京市經濟和信息化局發布的《2022年北京人工智能產業發展白皮書》中,明確提出支持頭部企業打造對標ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。
從預訓練到大模型的AI技術突破,是ChatGPT獲得成功的基礎。傳統的AI模型訓練中,標注成本一直是阻礙AI算法推向更大數據集合的障礙;而預訓練技術不依賴數據標注,就可以訓練出一個大規模深度學習模型。2020年6月,OpenAI發布了大型語言模型GPT—3,參數規模達到1750億,ChatGPT正是基于該模型的改進版而創建的。
大模型展現出的能力、潛力和豐富的應用場景,早已激發很多企業和研究機構投身這場競賽。2021年1月,谷歌大腦推出了1.6萬億參數規模超級模型。2020年11月,華為啟動了中文預訓練大模型項目,2021年4月,千億參數規模的盤古大模型發布。2021年6月,由北京智源人工智能研究院牽頭,多家機構參與共同研發的悟道2.0大模型,參數規模達到1.75萬億。阿里巴巴達摩院在2020年初啟動中文多模態預訓練模型M6項目,2021年10月,M6的參數規模擴展到10萬億,成為當時全球最大的AI預訓練模型。
蘇中認為,在這條數據、算法和算力三輪同時驅動的技術賽道上,中美兩國技術團隊已經形成了“兩駕馬車”的發展模式,不斷刷新人工智能能力規模上的邊界線。在AIGC(人工智能內容生成技術)高質量論文領域,中國和美國數量幾乎持平,并大幅度領先其他國家。
“人工智能可以成為我國自主創新的突破口。我國人工智能產業與美國相比雖有一定差距,但差距并不大。”宋宇說,比如面對大模型所需要的日趨龐大的算力需求,國內已建立多個超算中心,以及專門的人工智能算力中心?!罢w上看,我國現在的算力已經領先了人工智能的需求,為自主創新提供了保障?!?/p>
數據顯示,近年來,我國人工智能產業增速高于全球水平。2017年至2021年,我國人工智能產業規模增長了2.6倍,占全球比重提升到16.8%。2012年至2022年9月,全球人工智能領域發表的論文約100萬篇,其中28%的論文來自中國。中國高水平論文產出占比從2012年的20.36%增長到2021年的50.71%。專利數量上,全球人工智能專利累計授權量25萬件,中國占比60%。
迎接挑戰
ChatGPT已領先一步,中國企業能否趕超?
“ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,在回復速度上,ChatGPT也領先一截。”鄭榕認為,這種差距與數據質量有一定關系。AI的進化需要投喂大量數據,而全球互聯網的中文數據質量,相比于英文數據質量還有明顯差距。“我們要想辦法,做好中英文不同語言之間的數據互補?!编嶉耪f。
ChatGPT使用的大模型對計算資源消耗極大,這意味著需要大筆投資。2019年,微軟向OpenAI投資10億美元,2021年另一輪投資數額未公開。今年1月,微軟宣布將向OpenAI開展“多年、數十億美元”的投資,兩家公司沒有披露具體款項,但據美國媒體透露,微軟將向OpenAI投資100億美元。
面對這樣的門檻,胡堃建議通過政策發力整合資源?!按蠖鄶灯髽I無法承受人工智能發展對于算力等資源的巨大消耗,建議國家從政策層面整合相關資源,如建立統一的計算平臺,結束各企業計算資源割裂和重復建設的狀態,促成各方達成某種協議,共同建設,共獲收益。”胡堃說。
另一方面,門檻也是改進和趕超的機會。ChatGPT需要大量算力和能源投入,成本很高,大規模商用必須改進技術、降低成本。比如AI芯片不但需要保證高性能,還要做到高算力下低功耗,對此,國內芯片廠商可以有所作為。平臺型科技企業也可以發揮綜合優勢,與研究機構、高校等合作形成聯合創新主體,加速新一代AI技術的產品轉化。
“在體制機制上,要對開展自主創新的企業有足夠的耐心?!彼斡畋硎?,在國家層面,建議進一步完善對人才和機構的考核機制,要有長遠的目標和足夠的耐心讓企業自主創新,要有試錯容錯機制。
以ChatGPT為代表的人工智能內容生成技術,目前也面臨許多倫理問題和安全問題,如歧視、詐騙、抄襲、造謠、偽造身份等,需要在發展中加以規范。
多位專家表示,由于ChatGPT在中美科技競爭中扮演極其重要的角色,建議對相關技術和應用領域,采取鼓勵創新、包容審慎的監管原則。同時,加強行業指引,特別是在科研、生活服務、商業、消費等倫理與安全相對有保障的應用領域,要積極鼓勵發展。
期待在ChatGPT引爆的新一輪AI產業競爭中,中國企業可以大展宏圖。
來源:《經濟日報》