當(dāng)房子越建越高時(shí),就需要回頭看地基是不是堅(jiān)實(shí)。中國(guó)科學(xué)院院士、北京大學(xué)教授張平文團(tuán)隊(duì)最近在做一件事——給人工智能“大廈”夯基,即為人工智能機(jī)器學(xué)習(xí)中常用的數(shù)學(xué)符號(hào)提供一個(gè)通用標(biāo)準(zhǔn)。
人工智能作為一個(gè)高度交叉而又發(fā)展迅猛的學(xué)科,吸引了來(lái)自數(shù)學(xué)、物理、化學(xué)、生物甚至人文社科等不同領(lǐng)域的眾多研究人員參與其中。對(duì)于不同學(xué)科的研究人員來(lái)說(shuō),一個(gè)現(xiàn)實(shí)的問題就是如何消除信息鴻溝。統(tǒng)一數(shù)學(xué)符號(hào)等基礎(chǔ)性工作,看似簡(jiǎn)單,卻是人工智能長(zhǎng)遠(yuǎn)發(fā)展的“地基”。
“目前,人工智能的數(shù)理基礎(chǔ)還不成熟,但這也為廣大青年學(xué)者提供了更多創(chuàng)新機(jī)會(huì)。”在日前舉辦的2020北京智源大會(huì)上,張平文等專家圍繞人工智能下一個(gè)十年發(fā)展面臨的重大問題進(jìn)行交流探討,呼吁加強(qiáng)人工智能數(shù)理基礎(chǔ)等相關(guān)研究。
有望催生新的研究方向
中國(guó)科學(xué)院院士、清華大學(xué)教授張鈸認(rèn)為,第一代人工智能靠知識(shí)驅(qū)動(dòng),第二代人工智能靠數(shù)據(jù)驅(qū)動(dòng),目前進(jìn)入第三代人工智能發(fā)展期,主要靠認(rèn)知驅(qū)動(dòng)。“認(rèn)知驅(qū)動(dòng)中,深度學(xué)習(xí)研究尤為重要,發(fā)展前景廣闊,但仍需加強(qiáng)理論和方法等基礎(chǔ)性工作。”
張平文也認(rèn)為,機(jī)器學(xué)習(xí)等深度學(xué)習(xí)理論是當(dāng)前人工智能數(shù)理基礎(chǔ)研究的熱門方向之一。雖然在此次人工智能浪潮中,深度學(xué)習(xí)理論表現(xiàn)良好,但研究人員還不能解決它的可解釋性問題。
事實(shí)上,可解釋性、可計(jì)算性、泛化性、穩(wěn)定性等正是人工智能未來(lái)發(fā)展面臨的重大理論挑戰(zhàn)。例如可解釋性,“分兩個(gè)層面,一是從數(shù)學(xué)算法的角度解釋,二是從數(shù)學(xué)模型的角度解釋機(jī)器學(xué)習(xí)的問題。這些基礎(chǔ)性工作都有待深入研究。”張平文說(shuō)。
“機(jī)器學(xué)習(xí)是從數(shù)據(jù)中挖掘出有價(jià)值的信息。數(shù)據(jù)本身是無(wú)意識(shí)的,不能自動(dòng)呈現(xiàn)有用的信息。”北京大學(xué)長(zhǎng)聘教授張志華說(shuō),“怎樣才能找出有價(jià)值的信息?首先要給數(shù)據(jù)一個(gè)抽象的表示,然后進(jìn)行建模,再進(jìn)行計(jì)算。”
“機(jī)器學(xué)習(xí)想要實(shí)現(xiàn)的是從數(shù)據(jù)到?jīng)Q策到預(yù)測(cè)的過程,這意味著很多新問題會(huì)出現(xiàn),而這些新問題都有賴于通過加強(qiáng)算法、模型等數(shù)理基礎(chǔ)研究來(lái)解決。”張平文表示,數(shù)理基礎(chǔ)研究無(wú)法在短時(shí)間內(nèi)實(shí)現(xiàn),需要開展大量工作。
反過來(lái),“人工智能數(shù)理基礎(chǔ)研究對(duì)數(shù)學(xué)發(fā)展也非常重要,研究界期待未來(lái)可以產(chǎn)生類似于概率論的新的研究方向。雖然短時(shí)間內(nèi)不太可能實(shí)現(xiàn),但仍有這種可能性。”張平文說(shuō)。
為此,張平文鼓勵(lì)廣大青年學(xué)者投身人工智能數(shù)理基礎(chǔ)研究,“數(shù)理基礎(chǔ)研究別具活力,希望通過大家的努力使它趨于成熟,產(chǎn)生更多原創(chuàng)性成果”。
從應(yīng)用出發(fā)定夯基計(jì)劃
人工智能數(shù)理基礎(chǔ)研究涉及數(shù)學(xué)、概率統(tǒng)計(jì)、計(jì)算機(jī)理論等眾多學(xué)科,不同學(xué)科、不同研究方向使用的數(shù)學(xué)記號(hào)和表述不盡相同。看起來(lái)相去甚遠(yuǎn)的兩個(gè)記號(hào),可能表達(dá)的是同一個(gè)概念;在一個(gè)學(xué)科已經(jīng)公認(rèn)的優(yōu)美、簡(jiǎn)單的記號(hào),在另一個(gè)學(xué)科或許還需被重現(xiàn)發(fā)現(xiàn)、重新定義,而新定義的記號(hào)很可能遠(yuǎn)不如已有的記號(hào)方便。
這給新進(jìn)入該領(lǐng)域的科研人員和工程人員造成了不少麻煩。北京大學(xué)教授李鐵軍說(shuō):“機(jī)器學(xué)習(xí)的普及,迫切需要制定一套統(tǒng)一的數(shù)學(xué)記號(hào)。這將大大減輕研究人員在不同符號(hào)體系間反復(fù)切換的工作量。”
為人工智能研究提供一套統(tǒng)一的符號(hào)標(biāo)準(zhǔn),這項(xiàng)基礎(chǔ)工作“增強(qiáng)了不同領(lǐng)域研究人員的互相理解。研究人員在看其他領(lǐng)域成果的時(shí)候,也更容易看懂”。張平文呼吁研究人員在科研中盡量采用同一套符號(hào)標(biāo)準(zhǔn)來(lái)交流、寫論文,并為完善符號(hào)標(biāo)準(zhǔn)而努力。
也就是說(shuō),基礎(chǔ)研究要與應(yīng)用結(jié)合起來(lái)。“開展人工智能研究不能憑空想象,必須了解實(shí)際問題,考慮實(shí)際應(yīng)用需要。”張平文說(shuō)。
北卡羅來(lái)納大學(xué)教堂山分校終身教授朱宏圖對(duì)此表示認(rèn)同。他說(shuō):“人工智能領(lǐng)域的研究應(yīng)該從應(yīng)用角度出發(fā)。”
“人工智能的核心是如何利用收集的數(shù)據(jù)來(lái)為用戶創(chuàng)造價(jià)值,提高用戶滿意度。”朱宏圖認(rèn)為,隨著收集數(shù)據(jù)的方法越來(lái)越多、頻率越來(lái)越高,為用戶提供相應(yīng)的方案也會(huì)越來(lái)越多。“這為人工智能研究帶來(lái)了新機(jī)遇。”
朱宏圖表示,從研究需要出發(fā),為用戶提供更好的方案和服務(wù)環(huán)境,也需要加強(qiáng)算法、模型等數(shù)理基礎(chǔ)研究。
“人工智能數(shù)理基礎(chǔ)研究,一方面要強(qiáng)調(diào)它與應(yīng)用的連接,另一方面也應(yīng)該基于數(shù)學(xué)本身的基本問題開展研究。”李鐵軍認(rèn)為,雖然數(shù)理基礎(chǔ)研究當(dāng)下可能跟應(yīng)用聯(lián)系并不緊密,但有可能提供一些最基本的數(shù)學(xué)語(yǔ)言,深化人類對(duì)人工智能數(shù)學(xué)結(jié)構(gòu)的認(rèn)識(shí)。
實(shí)踐是檢驗(yàn)合作實(shí)效的“金鑰匙”
夯實(shí)人工智能“大廈”,加強(qiáng)數(shù)理基礎(chǔ)研究,“主要有兩條路,一是從高維空間走向低維空間,二是從低維空間走向高維空間,但無(wú)論哪條路都存在困難。”張平文說(shuō),不管走哪條路,都需要加強(qiáng)學(xué)術(shù)界與產(chǎn)業(yè)界及不同領(lǐng)域間的交流。
與會(huì)專家認(rèn)為,一直以來(lái),產(chǎn)業(yè)界與研究界的信息鴻溝制約著數(shù)理基礎(chǔ)研究的進(jìn)度。產(chǎn)業(yè)界擁有研究界缺乏的大數(shù)據(jù),而產(chǎn)業(yè)界欠缺研究界對(duì)實(shí)際應(yīng)用背后的科學(xué)認(rèn)識(shí)。
朱宏圖同時(shí)還擔(dān)任滴滴出行公司的首席統(tǒng)計(jì)學(xué)家。他表示,人工智能領(lǐng)域相關(guān)研究,數(shù)據(jù)在其中起著越來(lái)越重要的作用。企業(yè)積累了豐富的數(shù)據(jù),這是人工智能研究的重要基礎(chǔ)。
目前,在張平文等業(yè)內(nèi)人士的努力下,北京智源人工智能研究院已設(shè)立“人工智能數(shù)理基礎(chǔ)”重大研究方向,聯(lián)合全國(guó)相關(guān)科研院所和產(chǎn)業(yè)界人士,致力于打破基于計(jì)算機(jī)實(shí)驗(yàn)和神經(jīng)科學(xué)的人工智能的慣用建模范式,以可解釋性的新型人工智能模型、新型機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)的基礎(chǔ)研究等為研究?jī)?nèi)容,建立以數(shù)學(xué)與統(tǒng)計(jì)理論為數(shù)理基礎(chǔ)的新一代人工智能方法論。
香港浸會(huì)大學(xué)兼職教授季春霖認(rèn)為,研究將會(huì)面臨挑戰(zhàn)。他舉例說(shuō),在材料設(shè)計(jì)中,機(jī)器學(xué)習(xí)提供了新方法,但既有機(jī)器學(xué)習(xí)模型并不能直接拿來(lái)用,還需要把機(jī)器學(xué)習(xí)的模型和材料物理的模型結(jié)合起來(lái)。
在他看來(lái),人工智能數(shù)理基礎(chǔ)研究需要產(chǎn)業(yè)界和研究院所合作。這樣的合作將為行業(yè)發(fā)展創(chuàng)造更大空間,而實(shí)踐必將成為檢驗(yàn)合作實(shí)效的一把“金鑰匙”。
來(lái)源:《中國(guó)科學(xué)報(bào)》