當房子越建越高時,就需要回頭看地基是不是堅實。中國科學院院士、北京大學教授張平文團隊最近在做一件事——給人工智能“大廈”夯基,即為人工智能機器學習中常用的數學符號提供一個通用標準。
人工智能作為一個高度交叉而又發展迅猛的學科,吸引了來自數學、物理、化學、生物甚至人文社科等不同領域的眾多研究人員參與其中。對于不同學科的研究人員來說,一個現實的問題就是如何消除信息鴻溝。統一數學符號等基礎性工作,看似簡單,卻是人工智能長遠發展的“地基”。
“目前,人工智能的數理基礎還不成熟,但這也為廣大青年學者提供了更多創新機會。”在日前舉辦的2020北京智源大會上,張平文等專家圍繞人工智能下一個十年發展面臨的重大問題進行交流探討,呼吁加強人工智能數理基礎等相關研究。
有望催生新的研究方向
中國科學院院士、清華大學教授張鈸認為,第一代人工智能靠知識驅動,第二代人工智能靠數據驅動,目前進入第三代人工智能發展期,主要靠認知驅動。“認知驅動中,深度學習研究尤為重要,發展前景廣闊,但仍需加強理論和方法等基礎性工作。”
張平文也認為,機器學習等深度學習理論是當前人工智能數理基礎研究的熱門方向之一。雖然在此次人工智能浪潮中,深度學習理論表現良好,但研究人員還不能解決它的可解釋性問題。
事實上,可解釋性、可計算性、泛化性、穩定性等正是人工智能未來發展面臨的重大理論挑戰。例如可解釋性,“分兩個層面,一是從數學算法的角度解釋,二是從數學模型的角度解釋機器學習的問題。這些基礎性工作都有待深入研究。”張平文說。
“機器學習是從數據中挖掘出有價值的信息。數據本身是無意識的,不能自動呈現有用的信息。”北京大學長聘教授張志華說,“怎樣才能找出有價值的信息?首先要給數據一個抽象的表示,然后進行建模,再進行計算。”
“機器學習想要實現的是從數據到決策到預測的過程,這意味著很多新問題會出現,而這些新問題都有賴于通過加強算法、模型等數理基礎研究來解決。”張平文表示,數理基礎研究無法在短時間內實現,需要開展大量工作。
反過來,“人工智能數理基礎研究對數學發展也非常重要,研究界期待未來可以產生類似于概率論的新的研究方向。雖然短時間內不太可能實現,但仍有這種可能性。”張平文說。
為此,張平文鼓勵廣大青年學者投身人工智能數理基礎研究,“數理基礎研究別具活力,希望通過大家的努力使它趨于成熟,產生更多原創性成果”。
從應用出發定夯基計劃
人工智能數理基礎研究涉及數學、概率統計、計算機理論等眾多學科,不同學科、不同研究方向使用的數學記號和表述不盡相同。看起來相去甚遠的兩個記號,可能表達的是同一個概念;在一個學科已經公認的優美、簡單的記號,在另一個學科或許還需被重現發現、重新定義,而新定義的記號很可能遠不如已有的記號方便。
這給新進入該領域的科研人員和工程人員造成了不少麻煩。北京大學教授李鐵軍說:“機器學習的普及,迫切需要制定一套統一的數學記號。這將大大減輕研究人員在不同符號體系間反復切換的工作量。”
為人工智能研究提供一套統一的符號標準,這項基礎工作“增強了不同領域研究人員的互相理解。研究人員在看其他領域成果的時候,也更容易看懂”。張平文呼吁研究人員在科研中盡量采用同一套符號標準來交流、寫論文,并為完善符號標準而努力。
也就是說,基礎研究要與應用結合起來。“開展人工智能研究不能憑空想象,必須了解實際問題,考慮實際應用需要。”張平文說。
北卡羅來納大學教堂山分校終身教授朱宏圖對此表示認同。他說:“人工智能領域的研究應該從應用角度出發。”
“人工智能的核心是如何利用收集的數據來為用戶創造價值,提高用戶滿意度。”朱宏圖認為,隨著收集數據的方法越來越多、頻率越來越高,為用戶提供相應的方案也會越來越多。“這為人工智能研究帶來了新機遇。”
朱宏圖表示,從研究需要出發,為用戶提供更好的方案和服務環境,也需要加強算法、模型等數理基礎研究。
“人工智能數理基礎研究,一方面要強調它與應用的連接,另一方面也應該基于數學本身的基本問題開展研究。”李鐵軍認為,雖然數理基礎研究當下可能跟應用聯系并不緊密,但有可能提供一些最基本的數學語言,深化人類對人工智能數學結構的認識。
實踐是檢驗合作實效的“金鑰匙”
夯實人工智能“大廈”,加強數理基礎研究,“主要有兩條路,一是從高維空間走向低維空間,二是從低維空間走向高維空間,但無論哪條路都存在困難。”張平文說,不管走哪條路,都需要加強學術界與產業界及不同領域間的交流。
與會專家認為,一直以來,產業界與研究界的信息鴻溝制約著數理基礎研究的進度。產業界擁有研究界缺乏的大數據,而產業界欠缺研究界對實際應用背后的科學認識。
朱宏圖同時還擔任滴滴出行公司的首席統計學家。他表示,人工智能領域相關研究,數據在其中起著越來越重要的作用。企業積累了豐富的數據,這是人工智能研究的重要基礎。
目前,在張平文等業內人士的努力下,北京智源人工智能研究院已設立“人工智能數理基礎”重大研究方向,聯合全國相關科研院所和產業界人士,致力于打破基于計算機實驗和神經科學的人工智能的慣用建模范式,以可解釋性的新型人工智能模型、新型機器學習算法、深度學習的基礎研究等為研究內容,建立以數學與統計理論為數理基礎的新一代人工智能方法論。
香港浸會大學兼職教授季春霖認為,研究將會面臨挑戰。他舉例說,在材料設計中,機器學習提供了新方法,但既有機器學習模型并不能直接拿來用,還需要把機器學習的模型和材料物理的模型結合起來。
在他看來,人工智能數理基礎研究需要產業界和研究院所合作。這樣的合作將為行業發展創造更大空間,而實踐必將成為檢驗合作實效的一把“金鑰匙”。
來源:《中國科學報》