徐宗本院士在做主題報告
“人工智能的基石是數學,沒有數學基礎科學的支持,人工智能很難行穩至遠。” 在中國科學院院士、西安交通大學教授徐宗本看來,目前人工智能所面臨的一些基礎問題,其本質是來自數學的挑戰。
近日,由聯合國教科文組織和中國工程院聯合主辦的以“大數據與知識服務”為主題的聯合國教科文組織國際工程科技知識中心2019國際高端研討會上,徐宗本在題為《AI與數學:融通共進》的主題報告上如是說。
數學家眼里的人工智能是什么?
徐宗本給出的答案簡潔明了:當下主要指機器學習。
如果給這個名詞賦予一個說明,他認為這是人或者智能體,通過與環境的交互來提升自身行為和解決問題能力的智能化操作。“機器學習是把這種智能形式化為數學公式,轉換成計算機可以操作的算法和軟件。”
進一步說,人工智能實際上是一個將數學、算法理論和工程實踐緊密結合的領域。將其扒開來看,就是算法,也就是數學、概率論、統計學、各種數學理論的體現。
不過徐宗本認為,作為人工智能基石的數學,還存在五大核心問題待解,而這也是制約人工智能進一步發展的“絆腳石”。
第一是大數據的統計學基礎
徐宗本認為,人工智能和大數據是一對孿生姐妹。人工智能更多指應用模式,強調與領域知識的結合。大數據是最底層的信息技術,強調機器和機器、機器與人之間的內容交互與理解。但是當前,分析大數據的統計學基礎面臨顛覆,應用于復雜大數據分析的極限理論、統計推斷方法、真偽判定等數學基礎都尚未完全建立起來。
第二是大數據計算基礎算法
一般而言,理解和分析大數據都是通過數據處理或數據分析來實現的,而無論是數據處理還是數據分析最終都化歸到求解一系列基本的數學問題,像線性方程組求解、圖計算、最優化計算、高維積分等。不過,這些看似早已解決的問題在大數據情形下卻成了“攔路虎”。
為此,他以旅游為例,打了一個生動的比方來解釋這種挑戰。“比如從西安到北京,怎么走最近?過去地圖分辨率不高,根據普通的地圖可以獲取基本的路線。但現在大數據背景下地圖的分辨率越來越高,不可能一次就給你涵蓋西安至北京之間全部城市與道路的數據,只能一次一次地分別給其中某些城市之間的道路信息。如何在西安就知道到達北京需要多少時間,怎樣走最近?要帶多少錢? 現在的機器還回答不了這些問題。這就是由于分布式圖信息環境下圖計算基礎算法沒有解決的原因。”
第三是深度學習的數學理論
徐宗本認為,這個問題在當下尤為關鍵。新一輪的人工智能多以深度學習為基本模型,然而深度學習的設計基礎在哪?什么樣的結構決定了什么樣的性能?能不能有臺勞公式和富里埃級數這樣的數學表示理論?這些基本的理論問題還沒有解決。正是這個原因,現在的人工智能還得靠“人工”來換“智能“,這也是造成當下“人工智能=人工+智能”的緣由。
第四是非常規約束下的最優輸運
人工智能的很多問題都可歸納為兩個領域數據打通問題,即讓兩個對象在滿足某一個特定的不變量情況下互相轉移。“比如中英文互譯,它就是在保持語義的情況下將中文數據轉換成英文數據。”
如果應用到現實,徐宗本暢想,將醫院的CT和核磁共振圖像相互轉移或能很好地解決醫療診斷的信息不足問題。“因為照的是同一個人,這里人就是不變量。要解決這些問題,建立特定約束下如何實現最優傳輸的數學理論與方法是基本的。”
第五是關于學習方法論的建模與函數空間上的學習理論
徐宗本表示,研究生階段學到的機器學習理論,需上升到學習方法論學習的階段。
“從數學上說,無論函數空間上的學習理論怎么建立,本質是要適應不同的任務。由于任務本身是函數,是無窮的,那么就需要把過去機器學習中對樣本、數據的選擇、泛化,推廣到對任務的選擇、泛化上去。”
如果辯證地看待數學和人工智能的關系,相輔相成可能是其最好的詮釋。徐宗本表示,不僅數學可為人工智能提供基礎,人工智能也為數學研究提供新的方法論。
“比如解偏微分方程,過去人們可能會使用計算機,現在用人工智能可以做的更好。” 他認為,讓數學中的模型方法與人工智能的數據方法結合,可將機器的深度學習應用得更加精明。
面對如今發展如火如荼的人工智能產業,這位院士也給出了自己對從業者的希冀。
“人工智能想要做得好,要靠數學問題尤其是算法的解決。”徐宗本再次強調,從業者應潛心從基礎研究抓起,使我國的應用場景優勢真正轉化為技術優勢和產業優勢。
來源:科學網