“人工智能的基石是數(shù)學,沒有數(shù)學基礎科學的支持,人工智能很難行穩(wěn)致遠。” 近日,由聯(lián)合國教科文組織和中國工程院聯(lián)合主辦的聯(lián)合國教科文組織國際工程科技知識中心2019國際高端研討會上,中國科學院院士、西安交通大學教授徐宗本在題為《AI與數(shù)學:融通共進》的主題報告上如是說。
在他看來,目前人工智能所面臨的一些基礎問題,其本質(zhì)是來自數(shù)學的挑戰(zhàn)。
數(shù)學家眼里的人工智能是什么?徐宗本給出的答案簡潔明了:當下主要指機器學習。
如果給這個名詞賦予一個說明,他認為這是人或者智能體,通過與環(huán)境的交互來提升自身行為和解決問題能力的智能化操作。“機器學習是把這種智能形式化為數(shù)學公式,轉(zhuǎn)換成計算機可以操作的算法和軟件。”他說。
進一步說,人工智能實際上是一個將數(shù)學、算法理論和工程實踐緊密結(jié)合的領域。將其剖開來看,就是算法,也就是數(shù)學、概率論、統(tǒng)計學、各種數(shù)學理論的體現(xiàn)。
不過徐宗本認為,作為人工智能基石的數(shù)學,還存在五大核心問題待解,而這也是制約人工智能進一步發(fā)展的“絆腳石”。
第一是大數(shù)據(jù)的統(tǒng)計學基礎。徐宗本認為,人工智能和大數(shù)據(jù)是一對“孿生姐妹”。人工智能更多指應用模式,強調(diào)與領域知識的結(jié)合。大數(shù)據(jù)則是最底層的信息技術,強調(diào)機器和機器、機器與人之間的內(nèi)容交互與理解。但是當前,分析大數(shù)據(jù)的統(tǒng)計學基礎面臨顛覆,應用于復雜大數(shù)據(jù)分析的極限理論、統(tǒng)計推斷方法、真?zhèn)闻卸ǖ葦?shù)學基礎尚未完全建立起來。
第二是大數(shù)據(jù)計算基礎算法。一般而言,理解和分析大數(shù)據(jù)都是通過數(shù)據(jù)處理或數(shù)據(jù)分析來實現(xiàn)的,而無論是數(shù)據(jù)處理還是數(shù)據(jù)分析,最終都歸于求解一系列基本的數(shù)學問題,如線性方程組求解、圖計算、最優(yōu)化計算、高維積分等。不過,這些看似早已解決的問題在大數(shù)據(jù)情形下卻成了“攔路虎”。
他以旅游為例,打了一個生動的比方來解釋這種挑戰(zhàn)。“比如從西安到北京,怎么走最近?過去地圖分辨率不高,根據(jù)普通的地圖可以獲取基本的路線。但現(xiàn)在大數(shù)據(jù)背景下,地圖的分辨率越來越高,不可能一次就涵蓋西安至北京之間全部城市與道路的數(shù)據(jù),只能一次一次地提供其中某些城市間的道路信息。到達北京需要多少時間,怎樣走最近?要帶多少錢? 現(xiàn)在的機器還回答不了這些問題。這是由于在分布式圖信息環(huán)境下,圖計算的基礎算法問題還沒有解決。”徐宗本說。
第三是深度學習的數(shù)學理論。徐宗本認為,這個問題在當下尤為關鍵。新一輪的人工智能多以深度學習為基本模型,然而深度學習的設計基礎在哪里,什么樣的結(jié)構(gòu)決定了什么樣的性能,能不能有臺勞公式和富里埃級數(shù)這樣的數(shù)學表示理論,這些基本的理論問題還沒有解決。正是由于這個原因,現(xiàn)在的人工智能還得靠“人工”來換“智能”,這也是造成當下“人工智能=人工+智能”的原因。
第四是非常規(guī)約束下的最優(yōu)輸運。人工智能的很多問題都可歸納為兩個領域數(shù)據(jù)打通問題,即讓兩個對象在滿足某一個特定的不變量情況下互相轉(zhuǎn)移。“比如中英文互譯,就是在保持語義的情況下將中文數(shù)據(jù)轉(zhuǎn)換成英文數(shù)據(jù)。”
應用到現(xiàn)實,徐宗本暢想, 將醫(yī)院的CT和核磁共振圖像相互轉(zhuǎn)移或能很好地解決醫(yī)療診斷的信息不足問題。“因為照的是同一個人,這里人就是不變量。要解決這些問題,建立特定約束下實現(xiàn)最優(yōu)傳輸?shù)臄?shù)學理論與方法是基本的。”
第五是關于學習方法論的建模與函數(shù)空間上的學習理論。徐宗本表示,研究生階段學到的機器學習理論,需上升到方法論學習的階段。
“從數(shù)學上說,無論函數(shù)空間上的學習理論怎么建立,本質(zhì)是要適應不同的任務。由于任務本身是函數(shù),是無窮的,那么就需要把過去機器學習中對樣本、數(shù)據(jù)的選擇、泛化,推廣到對任務的選擇、泛化中。”
如果辯證地看待數(shù)學和人工智能的關系,相輔相成可能是其最好的詮釋。徐宗本表示,不僅數(shù)學可為人工智能提供基礎,人工智能也為數(shù)學研究提供新的方法論。
“比如解偏微分方程,過去人們可能會使用計算機,現(xiàn)在用人工智能可以做得更好。”他認為,讓數(shù)學中的模型方法與人工智能的數(shù)據(jù)方法結(jié)合,可將機器的深度學習應用得更加精確。
面對如今發(fā)展得如火如荼的人工智能產(chǎn)業(yè),徐宗本也道出了自己對從業(yè)者的希冀。
“人工智能想要做得好,要靠數(shù)學問題尤其是算法的解決。”徐宗本再次強調(diào),從業(yè)者應潛心從基礎研究抓起,使我國的應用場景優(yōu)勢真正轉(zhuǎn)化為技術優(yōu)勢和產(chǎn)業(yè)優(yōu)勢。
摘自《中國科學報》