楊立昆是當今世界頂尖的人工智能專家,為他的新書作序,頗具挑戰性。好在眾多專家已在人工智能領域探索了近70年,本文希望通過反思已走過路徑的合理性及局限性,探索人工智能的未來發展方向。
就像人可以分為精神和肉體兩個層次,機器智能也可以分為載體(具有特定結構的機器)和智能(作為一種現象的功能)兩個層次,兩個層次同樣重要。因此,我偏好用機器智能這個概念替代人工智能。
與機器智能相比,人工智能這個概念的重心在智能。“人工”二字高高在上的特權感主導了人工智能研究的前半葉,集中體現為符號主義。符號主義主張(由人)將智能形式化為符號、知識、規則和算法,認為符號是智能的基本元素,智能是符號的表征和運算過程。
符號主義的思想起源是數理邏輯、心理學和認知科學,并隨著計算機的發明而步入實踐。符號主義有過輝煌,但不能從根本上解決智能問題,一個重要原因是“紙上得來終覺淺”:人類抽象出的符號,源頭是身體對物理世界的感知,人類能夠通過符號進行交流,是因為人類擁有類似的身體。
計算機只處理符號,就不可能有類人感知和類人智能,人類可意會而不能言傳的“潛智能”,不必或不能形式化為符號,更是計算機不能觸及的。要實現類人乃至超人智能,就不能僅僅依靠計算機。
與符號主義自頂向下的路線針鋒相對的是連接主義。連接主義采取自底向上的路線,強調智能活動是由大量簡單單元通過復雜連接后并行運行的結果,基本思想是,既然生物智能是由神經網絡產生的,那就通過人工方式構造神經網絡,再訓練人工神經網絡產生智能。
人工神經網絡研究在現代計算機發明之前就開始了,1943年,沃倫·麥卡洛克和沃爾特·皮茨提出的M-P神經元模型沿用至今。連接主義的困難在于,它并不知道什么樣的網絡能夠產生預期智能,因此大量探索歸于失敗。
20世紀80年代神經網絡曾經興盛一時,掀起本輪人工智能浪潮的深度神經網絡只是少見的成功個案,不過這也是技術探索的常態。
人工智能的第三條路線是行為主義,又稱進化主義,思想來源是進化論和控制論。生物智能是自然進化的產物,生物通過與環境以及其他生物之間的相互作用發展出越來越強的智能,人工智能也可以沿這個途徑發展。
這個學派在20世紀80年代末90年代初興起,近年來頗受矚目的波士頓動力公司的機器狗和機器人就是這個學派的代表作。行為主義的一個分支方向是具身智能,強調身體對智能形成和發展的重要性。行為主義遇到的困難和連接主義類似,那就是什么樣的智能主體才是“可塑之才”。
機器學習從20世紀80年代中期開始引領人工智能發展潮流,本書給出了很通俗的定義:學習就是逐步減少系統誤差的過程,機器學習就是機器進行嘗試、犯錯以及自我調整等操作。機器學習對人工智能最重要的貢獻是把研究重心從人工賦予機器智能轉移到機器自行習得智能。近年來,最成功的機器學習方法是深度學習和強化學習。
深度學習是連接主義和機器學習相結合的產物,最大的貢獻是找到了一種在多層神經網絡上進行機器學習的方法,本書作者楊立昆和約書亞·本吉奧、杰弗里·辛頓因此獲得2018年度圖靈獎。
深度學習首先回答了什么樣的神經網絡可以訓練出智能,包括多層神經網絡和卷積神經網絡,也回答了訓練(學習)方法問題,包括受限玻爾茲曼機模型、反向傳播算法、自編碼模型等。深度學習對連接主義的重大意義是給出了一條訓練智能的可行途徑,對機器學習的重大意義則是給出了一個凝聚學習成效的可塑載體。
強化學習的思想和行為主義一脈相承,可追溯到1911年行為心理學的效用法則:給定情境下,得到獎勵的行為會被強化,而受到懲罰的行為會被弱化,這就是強化學習的核心機制——試錯。1989年,沃特金斯提出Q學習,證明了強化學習的收斂性。
2013年,谷歌子公司DeepMind將Q學習和深度神經網絡相結合,取得AlphaGo、AlphaZero(阿爾法元)和AlphaStar等重大突破。最近,DeepMind更是強調,只需要強化學習,就能實現通用人工智能。
與DeepMind極力推崇強化學習不同,楊立昆認為強化學習不過是錦上添花,傳統監督學習標注成本高,泛化能力有限,也只是點綴,自監督學習才是機器學習的未來。
自監督學習是通過觀察發現世界內在結構的過程,是人類(以及動物)最主要的學習形式,是“智力的本質”,這就是本書第九章的核心觀點。最近,楊立昆和另外兩位圖靈獎獲得者發表的論文Deep Learning for AI(《面向人工智能的深度學習》)中,也重點談了這個觀點。
有了三位圖靈獎獲得者的大力倡導,相信自監督學習將會掀起一波新的研究浪潮,但我不認為這就是“智力的本質”。根本原因在于,這只是從機器學習層次看問題,或者更一般地說,是從功能層次看問題。我認為,學習方法(功能)固然重要,從事學習的機器(結構)同樣重要,甚至更重要,因為結構決定功能。正如我開始時強調過的,永遠不要忘記作為智能載體的機器。
楊立昆在第九章開篇提到了法國航空先驅克萊芒·阿代爾,他比萊特兄弟早13年造出了能飛起來的載人機器。楊立昆從這位先驅身上看到的主要是教訓:“我們嘗試復制生物學機制的前提是理解自然機制的本質,因為在不了解生物學原理的情況下進行復制必然導致慘敗?!?/p>
他的立場也很清楚:“我認為,我們必須探究智能和學習的基礎原理,不管這些原理是以生物學的形式還是以電子的形式存在。正如空氣動力學解釋了飛機、鳥類、蝙蝠和昆蟲的飛行原理,熱力學解釋了熱機和生化過程中的能量轉換一樣,智能理論也必須考慮到各種形式的智能?!?/p>
我的看法和他不同,我認為克萊芒·阿代爾(和萊特兄弟)不僅沒有“慘敗”,而且取得了偉大的成功。
原因很簡單:克萊芒·阿代爾1890年和萊特兄弟1903年分別發明飛機,而空氣動力學是1939—1946年才建立起來的。兩次世界大戰中發揮重大作用的飛機,主要貢獻來自克萊芒·阿代爾和萊特兄弟的工程實踐,而不是空氣動力學理論的貢獻,因為空氣動力學還沒出現。
另一個基本事實是,至今空氣動力學也沒能全面解釋飛機飛行的所有秘密,更沒有全面解釋各種動物的飛行原理??諝鈩恿W很偉大,但它是“事后諸葛亮”,對于優化后來的飛機設計意義重大,但它不是指導飛機發明的理論導師。
智能比飛行要復雜得多,深度學習成功實現了智能,但是能夠解釋這種成功的理論還沒出現,我們并不能因此否定深度學習的偉大意義。楊立昆和另外兩位圖靈獎獲得者的偉大,和克萊芒·阿代爾及萊特兄弟之偉大的性質相同。
我們當然要追求智能理論,但是不能迷戀智能理論,更不能把智能理論當作人工智能發展的前提。如果這里的智能理論還試圖涵蓋包括人類智能在內的“各種形式的智能”,則這種理論很可能超出了人類智能可理解的范圍。
所以,盡管自監督學習是值得探索的一個重要方向,它也只是探索“智力的本質”漫漫長途中的一個階段。
人類和很多動物具有自監督學習能力,并不是自監督學習多神奇,而是因為他(它)們擁有一顆可以自監督學習的大腦,這才是智力的本質所在。機器要進行自監督學習,也要有自己的大腦,至少要有深度神經網絡那樣的可塑載體,否則自監督學習無從發生。
相比之下,強化學習的要求簡單得多,一個對溫度敏感的有機大分子就能進行強化學習,這正是生命和智能出現的原因。所以,強化學習才是更基本的學習方法。
當然,從零開始強化學習,確實簡單粗暴、浪費巨大,這也是強化學習思想提出百年并沒取得太大進展的重要原因。強化學習近十年來突然加速,是因為有了深度神經網絡作為訓練的結構基礎,因而在圍棋、《星際爭霸》等游戲中超越人類。不過,人類輸得并不心甘情愿,抱怨的主要理由是機器消耗的能源遠高于人類大腦。
我認為這種抱怨是片面的,人類棋手大腦的功耗確實只有數十瓦,但訓練一個人類棋手要花費十多年時間。更重要的是,人類棋手學圍棋時是帶著大腦這個先天基礎的,這顆大腦是億萬年進化來的,消耗了巨大的太陽能,這都應該記到能耗的總賬中。這樣比較,到底是機器棋手還是人類棋手能耗更大呢?
從節省能源角度看,機器智能確實不應該從頭再進化一次,而是應該以進化訓練好的生物神經網絡為基礎,這就是純粹的連接主義:構造一個逼近生物神經網絡的人工神經網絡。
1950年,圖靈的開辟性論文《計算機與智能》中就表達了這個觀點:“真正的智能機器必須具有學習能力,制造這種機器的方法是,先制造一個模擬童年大腦的機器,再教育訓練它?!边@也是類腦智能或神經形態計算的基本出發點。
相關科研實踐開始于20世紀80年代,基本理念就是構造逼近生物神經網絡的神經形態光電系統,再通過訓練與交互,實現更強的人工智能乃至強人工智能。
除了改進訓練對象的先天結構,訓練不可或缺的另一個要素是環境。環境才是智能的真正來源,不同環境孕育不同智能。人們往往把今天人工智能系統的成功歸結為三個要素:大數據+大算力+強算法,其中數據是根本,另外兩個要素主要影響效率。訓練更強智能,需要更大數據,這是智能發展的基本規律。
但即便是大數據,也不能完整有效地表達環境,數字孿生能更全面地刻畫物理環境,更好地保留環境自有的時空關系,因此也能夠哺育出更強的人工智能。物理世界的模型化本來就是科學最核心的任務,以前從中發現規律的是人類,未來這個發現主體將擴展到機器。
行文至此,我們已經從人工智能發展史中小心翼翼地挑出三根靠得住的基本支柱:一是神經網絡,二是強化學習,三是環境模型。在這三根支柱中,楊立昆最突出的貢獻是對神經網絡的貢獻,特別是卷積神經網絡。至于想到用卷積神經網絡,是因為借鑒了生物神經感知系統,這就是卷積神經網絡在圖像識別和語音識別等領域大獲成功的主要原因——深度神經網絡已經借鑒了生物神經網絡的部分結構。
總而言之,人工智能經典學派有三個:符號主義、連接主義和行為主義。符號描述和邏輯推理不是智能的基礎,而是一種表現,讀寫都不會的文盲就擁有的“低級”智能才更基礎。因此,連接主義和行為主義雖然困難重重,但有著更強的生命力,從中發展出的深度學習和強化學習兩套方法,成為當今支撐人工智能的兩大主要方法。
最后需要強調的是,人類智能是地球環境培育出的最美麗的花朵,我們在為自己驕傲的同時,也要警惕人類中心主義。
來源:《中國科學報》