當房子越建越高時,就需要回頭看地基是不是堅實。中國科學(xué)院院士、北京大學(xué)教授張平文團隊最近在做一件事——給人工智能“大廈”夯基,即為人工智能機器學(xué)習(xí)中常用的數(shù)學(xué)符號提供一個通用標準。
人工智能作為一個高度交叉而又發(fā)展迅猛的學(xué)科,吸引了來自數(shù)學(xué)、物理、化學(xué)、生物甚至人文社科等不同領(lǐng)域的眾多研究人員參與其中。對于不同學(xué)科的研究人員來說,一個現(xiàn)實的問題就是如何消除信息鴻溝。統(tǒng)一數(shù)學(xué)符號等基礎(chǔ)性工作,看似簡單,卻是人工智能長遠發(fā)展的“地基”。
“目前,人工智能的數(shù)理基礎(chǔ)還不成熟,但這也為廣大青年學(xué)者提供了更多創(chuàng)新機會。”在日前舉辦的2020北京智源大會上,張平文等專家圍繞人工智能下一個十年發(fā)展面臨的重大問題進行交流探討,呼吁加強人工智能數(shù)理基礎(chǔ)等相關(guān)研究。
有望催生新的研究方向
中國科學(xué)院院士、清華大學(xué)教授張鈸認為,第一代人工智能靠知識驅(qū)動,第二代人工智能靠數(shù)據(jù)驅(qū)動,目前進入第三代人工智能發(fā)展期,主要靠認知驅(qū)動?!罢J知驅(qū)動中,深度學(xué)習(xí)研究尤為重要,發(fā)展前景廣闊,但仍需加強理論和方法等基礎(chǔ)性工作?!?nbsp;
張平文也認為,機器學(xué)習(xí)等深度學(xué)習(xí)理論是當前人工智能數(shù)理基礎(chǔ)研究的熱門方向之一。雖然在此次人工智能浪潮中,深度學(xué)習(xí)理論表現(xiàn)良好,但研究人員還不能解決它的可解釋性問題。
事實上,可解釋性、可計算性、泛化性、穩(wěn)定性等正是人工智能未來發(fā)展面臨的重大理論挑戰(zhàn)。例如可解釋性,“分兩個層面,一是從數(shù)學(xué)算法的角度解釋,二是從數(shù)學(xué)模型的角度解釋機器學(xué)習(xí)的問題。這些基礎(chǔ)性工作都有待深入研究。”張平文說。
“機器學(xué)習(xí)是從數(shù)據(jù)中挖掘出有價值的信息。數(shù)據(jù)本身是無意識的,不能自動呈現(xiàn)有用的信息?!北本┐髮W(xué)長聘教授張志華說,“怎樣才能找出有價值的信息?首先要給數(shù)據(jù)一個抽象的表示,然后進行建模,再進行計算。”
“機器學(xué)習(xí)想要實現(xiàn)的是從數(shù)據(jù)到?jīng)Q策到預(yù)測的過程,這意味著很多新問題會出現(xiàn),而這些新問題都有賴于通過加強算法、模型等數(shù)理基礎(chǔ)研究來解決?!睆埰轿谋硎荆瑪?shù)理基礎(chǔ)研究無法在短時間內(nèi)實現(xiàn),需要開展大量工作。
反過來,“人工智能數(shù)理基礎(chǔ)研究對數(shù)學(xué)發(fā)展也非常重要,研究界期待未來可以產(chǎn)生類似于概率論的新的研究方向。雖然短時間內(nèi)不太可能實現(xiàn),但仍有這種可能性。”張平文說。
為此,張平文鼓勵廣大青年學(xué)者投身人工智能數(shù)理基礎(chǔ)研究,“數(shù)理基礎(chǔ)研究別具活力,希望通過大家的努力使它趨于成熟,產(chǎn)生更多原創(chuàng)性成果”。
從應(yīng)用出發(fā)定夯基計劃
人工智能數(shù)理基礎(chǔ)研究涉及數(shù)學(xué)、概率統(tǒng)計、計算機理論等眾多學(xué)科,不同學(xué)科、不同研究方向使用的數(shù)學(xué)記號和表述不盡相同。看起來相去甚遠的兩個記號,可能表達的是同一個概念;在一個學(xué)科已經(jīng)公認的優(yōu)美、簡單的記號,在另一個學(xué)科或許還需被重現(xiàn)發(fā)現(xiàn)、重新定義,而新定義的記號很可能遠不如已有的記號方便。
這給新進入該領(lǐng)域的科研人員和工程人員造成了不少麻煩。北京大學(xué)教授李鐵軍說:“機器學(xué)習(xí)的普及,迫切需要制定一套統(tǒng)一的數(shù)學(xué)記號。這將大大減輕研究人員在不同符號體系間反復(fù)切換的工作量?!?/p>
為人工智能研究提供一套統(tǒng)一的符號標準,這項基礎(chǔ)工作“增強了不同領(lǐng)域研究人員的互相理解。研究人員在看其他領(lǐng)域成果的時候,也更容易看懂”。張平文呼吁研究人員在科研中盡量采用同一套符號標準來交流、寫論文,并為完善符號標準而努力。
也就是說,基礎(chǔ)研究要與應(yīng)用結(jié)合起來?!伴_展人工智能研究不能憑空想象,必須了解實際問題,考慮實際應(yīng)用需要。”張平文說。
北卡羅來納大學(xué)教堂山分校終身教授朱宏圖對此表示認同。他說:“人工智能領(lǐng)域的研究應(yīng)該從應(yīng)用角度出發(fā)?!?/p>
“人工智能的核心是如何利用收集的數(shù)據(jù)來為用戶創(chuàng)造價值,提高用戶滿意度?!敝旌陥D認為,隨著收集數(shù)據(jù)的方法越來越多、頻率越來越高,為用戶提供相應(yīng)的方案也會越來越多。“這為人工智能研究帶來了新機遇?!?/p>
朱宏圖表示,從研究需要出發(fā),為用戶提供更好的方案和服務(wù)環(huán)境,也需要加強算法、模型等數(shù)理基礎(chǔ)研究。
“人工智能數(shù)理基礎(chǔ)研究,一方面要強調(diào)它與應(yīng)用的連接,另一方面也應(yīng)該基于數(shù)學(xué)本身的基本問題開展研究?!崩铊F軍認為,雖然數(shù)理基礎(chǔ)研究當下可能跟應(yīng)用聯(lián)系并不緊密,但有可能提供一些最基本的數(shù)學(xué)語言,深化人類對人工智能數(shù)學(xué)結(jié)構(gòu)的認識。
實踐是檢驗合作實效的“金鑰匙”
夯實人工智能“大廈”,加強數(shù)理基礎(chǔ)研究,“主要有兩條路,一是從高維空間走向低維空間,二是從低維空間走向高維空間,但無論哪條路都存在困難。”張平文說,不管走哪條路,都需要加強學(xué)術(shù)界與產(chǎn)業(yè)界及不同領(lǐng)域間的交流。
與會專家認為,一直以來,產(chǎn)業(yè)界與研究界的信息鴻溝制約著數(shù)理基礎(chǔ)研究的進度。產(chǎn)業(yè)界擁有研究界缺乏的大數(shù)據(jù),而產(chǎn)業(yè)界欠缺研究界對實際應(yīng)用背后的科學(xué)認識。
朱宏圖同時還擔任滴滴出行公司的首席統(tǒng)計學(xué)家。他表示,人工智能領(lǐng)域相關(guān)研究,數(shù)據(jù)在其中起著越來越重要的作用。企業(yè)積累了豐富的數(shù)據(jù),這是人工智能研究的重要基礎(chǔ)。
目前,在張平文等業(yè)內(nèi)人士的努力下,北京智源人工智能研究院已設(shè)立“人工智能數(shù)理基礎(chǔ)”重大研究方向,聯(lián)合全國相關(guān)科研院所和產(chǎn)業(yè)界人士,致力于打破基于計算機實驗和神經(jīng)科學(xué)的人工智能的慣用建模范式,以可解釋性的新型人工智能模型、新型機器學(xué)習(xí)算法、深度學(xué)習(xí)的基礎(chǔ)研究等為研究內(nèi)容,建立以數(shù)學(xué)與統(tǒng)計理論為數(shù)理基礎(chǔ)的新一代人工智能方法論。
香港浸會大學(xué)兼職教授季春霖認為,研究將會面臨挑戰(zhàn)。他舉例說,在材料設(shè)計中,機器學(xué)習(xí)提供了新方法,但既有機器學(xué)習(xí)模型并不能直接拿來用,還需要把機器學(xué)習(xí)的模型和材料物理的模型結(jié)合起來。
在他看來,人工智能數(shù)理基礎(chǔ)研究需要產(chǎn)業(yè)界和研究院所合作。這樣的合作將為行業(yè)發(fā)展創(chuàng)造更大空間,而實踐必將成為檢驗合作實效的一把“金鑰匙”。
來源:《中國科學(xué)報》