4月17日下午,湛廬特別邀請圣塔菲研究所客座教授、《AI 3.0》一書作者梅拉妮·米歇爾,中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任王飛躍,馭勢科技聯合創始人、董事長兼CEO吳甘沙,清華大學計算機系副教授、智源青年科學家劉知遠等國內外知名科學家和創業者,以及特別嘉賓達闥云端機器人小姜,一起探討AI 3.0時代的新商機和新生態。
這次全智能場景發布會第一次采用了演播室和戶外智能場景雙現場形式,在無人駕駛汽車和云端智能機器人的烘托下,全面展示了中國人工智能領域的創新實力和前沿進展。幾位科學家、企業家跨界深度交流,共同探討了人工智能發展現狀,以及透視當下AI發展的關鍵問題,并對產業布局和政策提出了可供參考的建議,助力未來的想象與開創。
以下為清華大學計算機系副教授、智源青年科學家劉知遠的演講精華內容
清華大學計算機系副教授 智源青年科學家 劉知遠
《AI 3.0》的作者米歇爾教授通過深入淺出的方式,把人工智能的發展歷程,特別是其內在的技術路線的邏輯呈現給了大家,并提出了人工智能未來發展將會面臨的一些非常重要的命題,以及無人駕駛、自然語言處理等人工智能非常重要的應用場景。我相信從技術路線的發展上來講,未來會有更多探索的可能性。我相信這是所有學者都在追尋的問題。
AI 3.0,一個“大數據”和“大知識”融合的時代
說到“AI 3.0”,那么必然存在“AI 1.0”和“AI 2.0”。人工智能學者有一個重要共識,那就是人工智能的發展已經歷了兩個非常重要的階段:從“小數據”(small data)到“大數據”(big data),再到“智慧數據”(smart data)的過程。從語言理解這個層面,我認為人工智能的發展基本上也可以劃分成三個階段。
第一個階段,自然語言處理最初是從機器翻譯開始的。最開始,我們通過人為地編寫一些翻譯的規則,再配一個詞典,以實現機器翻譯。這個階段對應“AI 1.0”。
后來,人們發現這個做法不可行,因為人類的語言千變萬化,我們很難通過一套人工編寫的規則來覆蓋所有情形。到了20世紀90年代,有人提出用機器學習方法,通過大規模的數據,讓人工智能自動學習翻譯的規則。隨后,人們進一步使用神經網絡來挖掘每個詞背后的深層語義信息,以實現對整句話的理解。這是第二個階段,它對應的是“AI2.0”。
從自然語言處理這個角度來講,人工智能在這一階段已經達到一個新的高峰。我們在智源研究院的支持下做的“悟道”模型——超大規模的預訓練模型,就是想要用互聯網級別的大規模的文本數據來學習各種語言的語言模型。
那么,是不是數據越多、模型越大其語言理解能力就越強?這就要提到人工智能第三個階段“AI 3.0”,我認為答案是否定的。到第三個階段一定會有一個更新的框架,人工智能應該能夠從大數據里學到更好地反映人類對這個世界認知相關知識的能力,這類似于我們外在有一個世界模型,它一定不是像現在的神經網絡,而是應該有知識體系、層次結構,至于它具體是什么樣的,從我的角度來看未來應該是要把大數據和“大知識”(big knowledge)結合,即從AI 1.0階段的符號人工智能路線升級到第三階段的AI 3.0,充分對人類的知識進行建模,從而支持各種各樣的包括自然語言處理在內的人工智能應用。
多模態,人工智能認知世界的全新形式
人類的認知其實是多模態的,有視覺的、聽覺的、語言的等,因此我們希望計算機在認識世界時也是多模態的。
米歇爾教授在《AI 3.0》中也提到了,在自動駕駛方面,人工智能領域正越來越多地討論關于賦予機器常識的重要性,人工智能對于語言、圖像的理解需要各種各樣的包括抽象能力、類比能力、常識在內的復雜知識的支持。未來的人工智能需要像人一樣,構建出關于這個世界的全面的認知體系,這是非常重要的。
最近這兩三年在自然語言處理以及在計算機視覺領域有一個非常重要的趨勢,那就是如何讓互聯網上的大規模的文本、圖像、視頻等數據為我所用,讓計算機能夠自動從中學習我們的語言、視覺識別的相關知識。其實這幾年我們在這方面取得了一個非常重大的突破——預訓練模型,也就是說我們不需要再去人為標注任何數據了,我們可以直接讓模型從大規模的數據里進行自動學習,因此,我們稱之為自監督的學習。
同時,我們希望利用數據驅動的方法從數據中獲取更多的關于語言理解的知識,其實這就是from data to knowledge(從數據到知識)。不過,我認為現在的這種“data追問”的方法實際上無法比較好地還原我們人類對這個世界的認知模型,包括抽象層次的結構、復雜的關系,不同類型的知識等。然而,現在的訓練模型的確可以通過大規模的數據習得生成流暢語言的能力,這說明它其實已經學到了很多關于語言的知識,比如語法的規則等,互聯網上的語言文本的數據,可以看成是我們大腦中語言能力的外在體現。所以,在我看來“data追問”的方法一定是未來的一個非常重要的需要繼續堅持的路徑。
當然,我們同時也要充分借鑒AI1.0時代人類知識的構建模式,比如我們對于類比、隱喻、抽象學習這樣一些相關能力的先驗的認識——元認知或元知識,我們要把這兩者結合起來。也就是說我們可能會有一些底層的從數據中心獲得的比較具體的“知識”,我們可能還會有一些“大腦”,我們要把這兩者結合起來,由這些“大腦”指導我們的學習過程,進而得到一個更類似于人類學習能力的語言學習模型,這是我認為的未來自然語言處理的一個重要的發展路徑。
“悟道1.0”是智源發布的一個最初版本,我們希望其能夠不斷演化,在各大高校和研究機構的支持下,利用大數據、大算力以及學生們的聰明才智,一起推動這個領域的發展。
重構人類的知識平臺,人工智能的未來使命
在我看來,未來的計算機一定能夠更好地服務于我們和我們社會,比如在人的生老病死、衣食住行等各個方面肯定都能發揮很重要的作用。
我主要是從事自然語言處理,具體來說是知識圖譜方面的研究,我認為整個人類社會的發展其實是不斷積累我們認識世界、改造世界的知識的過程,但其實就我們現在的社會來說,每個人的分工、知識體系其實都是高度專業化的,而且會越來越專業化。
每個人其實都只是整個人類知識的拼圖里很小的一塊,而且這一塊可能會越來越小,因為整個拼圖其實變得越來越大了,這時,對于人類社會來說,認識世界、改造世界會變得越來越難。那么,隨著拼圖越來越大,我們到底該如何學才能更高效地把通識教育學習得更好,這是我們應該思考的問題。比如,對于生物學家或者醫生而言,他會面臨一些挑戰,從去年新冠疫情出現至今,關于新冠病毒的論文已經有幾萬篇了,那么對于從事這個領域研究的學者來說,他應該如何讀這么多論文,其實本身我覺得對于學者來講,或者說對于人類社會的每個人來講,他想要再去創造新的知識就會變得越來越難,因為他所需的積累會變得越來越多。
所以,我認為人工智能未來的一個非常大的使命,就是幫助人類把這個平臺構建起來,使其成為我們的一個外部知識庫,這樣一來,我們只需掌握如何去利用這個知識庫,就可以更好地認識世界、改造世界。
每個人都能夠借助人工智能,走向一個更高的地方
米歇爾教授在書中最后提到了6個問題,其中計算機能夠具有創造性嗎?我們距離創建通用的人類水平人工智能還有多遠?都是非常關鍵的問題,需要我們不斷地去探索并找到答案。
20世紀五六十年代的學者在面向未來時,他們也不知道該如何走,他們各自提出了一些技術路線,然后不斷得以演化,這也是一個跌宕起伏的展過程。雖然人工智能至今只有近70年的歷史,但其發展歷程可謂波瀾壯闊,經歷過高峰,也經歷過低谷。這一發展歷程正體現了一代又一代的人工智能學者的不懈探索。
說到人工智能的發展,它源于很多領域專家的共同努力,比如數學家、控制論的專家、計算機專家以及腦科學家和神經科學家等。所以,人工智能其實是一個交叉學科,其中甚至包含一些哲學、倫理學方面的研究。
因此,未來人工智能的發展需要摒棄“人工智能就是一門獨立的學科”這種觀念,我們需要綜合多學科的努力才能推動這個領域的發展。那么,在人才培養上,我們應該重視培養交叉學科的能力和專業素養,這是人工智能跟其他的學科發展的不同之處。
每個人都在不斷地探索這個世界、獲取新的知識,但是這些知識可能都是散落在各處的,我希望未來的人工智能像粘合劑一樣,把這些知識拼出一個人類認識這個世界的途徑,使得每個人都能借助人工智能,走向一個更高的地方。