作者按:2018年11月1日,記者從中國人工智能學會發布的《獎勵通報》獲悉,中國科學院數學與系統科學研究院研究員、中國科學院院士陸汝鈐憑借其在知識工程方面取得的系統性創新成就,特別是在全過程動畫自動生成、專家系統開發環境、軟件自動生成、少兒圖靈測試、知件、大知識特征刻畫等方面取得的多項為國際公認的領先成果,成為首位“吳文俊人工智能最高成就獎”獲得者,獲頒100萬元人民幣獎金。
這是2016年12月23日采訪陸汝鈐院士的稿子。
移動互聯網、大數據的普及和應用,對人工智能的需求變得越來越迫切,也給人工智能的研究提供了更加廣闊的舞臺,作為人工智能領域重要研究方向的知識工程也迎來了大好的發展時機。
作為我國人工智能領域研究的開拓者之一,陸汝鈐院士在知識工程和基于知識的軟件工程方面做了系統的、創造性的工作。如今,81歲高齡的陸院士,矢志不渝、桑榆未晚,仍然堅持在科研、教學的第一線,還親自加入到大數據知識工程項目研究團隊,踐行著對自己的期望:潛心科研,腳踏實地去多做事情。
陸汝鈐,計算機科學家,中國科學院數學與系統科學研究院數學研究所研究員。在知識工程和基于知識的軟件工程方面做了系統的、創造性的工作,是我國該領域研究的開拓者之一。倡導并主持完成了以軟件的機械化生成和移植為目標的系列軟件計劃(XR計劃),推動了當時國產機軟件缺乏問題的解決。設計并主持研制了知識工程語言TUILI和大型專家系統開發環境《天馬》。首次把異構型DAI和機器辯論引進人工智能領域。研究出基于類自然語言理解的知識自動獲取方法,把ICAI生成技術推進到以自動知識獲取為特征的第三代,并開發出基于知識的應用軟件自動生成技術。研究出能把中文童話故事自動轉換成動畫片的計算機動畫全過程自動生成技術,在藝術創造領域內推進了人工智能。 1999年當選為中國科學院院士。
中國科學院院士 陸汝鈐
計算智能一枝獨秀
記者:作為中國人工智能領域研究的開拓者之一,請您首先給讀者科普一下人工智能知識?您對我國當前比較火熱的人工智能產業怎樣看待?
陸汝鈐:智能在不同的生物物種上都有體現,而在人類身上達到極致,是人類最主要特征之一。人工智能研究的一個主要目的是使機器能夠勝任一些通常需要人類智能才能完成的復雜工作。然而,什么是人類智能,科學界至今還沒有給出令人滿意的定義。既然人類智能無法被精確定義,對什么是人工智能這一關鍵問題也就很難回答。
從人工智能發展的幾個階段以及人們對問題的討論來看,我歸納出智能的三個層次:其中最普遍的一種看法是,凡是需要計算機來模擬人的大腦思維去做事情就是智能。比如計算機做計算、做文字的解讀、做推理、寫文章、作曲、繪畫等都屬于這個范疇。計算機科學元老圖靈在1950年提出的著名“圖靈測試”——讓一個人類裁判和處于另一個房間的另一個人(A)加一臺計算機(B)通過網絡書面談話。每一場談話算是一次測試。如果在大量測試中,有相當比例的“中等智力”裁判無法通過書面談話區分A和B中誰是人,誰是計算機,則稱該計算機通過了圖靈測試。研究如何使計算機具有智能相當于研究如何使計算機通過圖靈測試。它是關于智能標準的一個明確定義。
窄一點來說,也可以認為計算機能進行創造性思維才是智能的。計算機做一些固定的、有規律的計算任務,并不需要“聰明才智”,不算是智能。只有在不確定的條件下,計算機還能適當運用并能去解決問題的,才是智能。
廣一點來說,凡是需要涉及到用人腦(不一定是大腦)去完成的任務,也都可以算是體現了智能。美國的仿生機器人“大狗”能夠在復雜地形上負重快跑,其身體平衡能力的掌控就模擬了人類小腦的功能。上述的這三種對智能的定義,大多數情況下人們更多地認可第一種理解。
人工智能是一門研究人類智能的機理以及如何用機器模擬人的智能的學科,是人編程、造機器來仿照人的智能行為。若問什么方是發展人工智能的最有效途徑,專家們大致有三種不同的觀點。
第一種,符號主義。是一種基于邏輯推理的智能模擬方法。這方面的代表人物有紐維爾和西蒙,他們提出了著名的“物理符號系統假設”,認為世界上存在著一種物理符號系統,只要充分發現和建設好這個系統,一切的智能系統就能用這個系統來描述和模擬。
第二種,行為主義。認為人工智能源于控制論,只要求計算機能夠控制機器或物體去模擬人所要求的行為,而不需要太注重它的大腦意識是如何操作的,這就是行為主義。行為主義方面的代表人物首推布魯克斯,他的“無表示智能”工作在第12屆國際人工智能聯合大會上獲得“計算機與思維獎”。在此基礎上設計的六足行走機器人,被看作是新一代的“控制論動物”,是一個基于“感知—動作模式”模擬昆蟲行為的控制系統。
第三種,計算智能。認為無論什么事情都能通過計算來解決和達到。如果智能沒達到,可能是計算理念沒達到或計算速度沒達到。計算智能的基礎包含仿生學。它把世界上各種生物的智能行為,總結成神經智能、蟻群智能、鳥群智能等仿生模型,通過大量的計算來實現。霍普菲爾德和欣頓也許可以算是計算智能的代表人物,是他們帶來了上世紀80年代初神經網絡學派的強勢回歸。
人工智能最初是專注計算機實現一定的算法來進行問題求解。傳統的人工智能強調研究人類思維的普遍規律,研究通用的推理算法,強調解決問題的策略。斯坦福大學的費根鮑姆教授發現這樣的思路具有很大的局限性,它不能解決現實世界中許多復雜的問題。僅憑規則而沒有豐富的知識是無法達到人們所預期的美好愿景。
上世紀六十年代末至七十年代初,費根鮑姆開始研究以專家知識為核心的專家系統技術。1977年他在第五屆國際人工智能聯合大會上正式提出了知識工程的概念。此概念很快被人工智能界接受。一批批實用專家系統的問世,產生了較大的經濟效益和社會影響。1994年費根鮑姆因此獲得圖靈獎,世界性的成功使得知識工程似乎成了實現人工智能的第四條途徑。
進入新世紀,特別是大數據時代以后,人們對如何實現人工智能也有了新的認識。在前面提到的人們認為可以實現人工智能的多條可能途徑中,計算智能展現出越來越大的潛力。隨著高性能計算機的出現、各種各樣高科技軟環境,尤其是深度學習的崛起,加上各種智能化技術越來越多地依靠計算,使得計算智能在人工智能的眾多技術中顯現出一枝獨秀的趨勢。
以知識工程為代表的、基于知識的智能化研究正在逐步和計算智能合流。正如吳信東教授指出的,知識獲取的來源已經從知識工程初期的主要從專家獲得,逐步轉變為主要向大數據挖掘索取,基于海量計算的從大數據里提煉知識成為知識獲取的重要途徑,這是人工智能的一個重要發展方向。以上這些是我對現代人工智能發展的理解和看法。
潛心知識工程的研究和開拓
記者:知識工程是人工智能的原理和方法,它強調以人類知識作為機器智能的基礎,研究知識的表示、獲取、轉換、推理和應用,被視作推動技術進步的關鍵手段。為了解決知識工程中的瓶頸問題,您做了哪些基礎研究和開拓性的工作?
陸汝鈐:我是1980年從國外教授做的報告中第一次聽到這個名詞。
我們在知識工程這個領域主要做了三件事情。
第一件事情是1983年后期~1990年初,主要是關注于知識工程的工具、技術和開發環境。首先設計并主持研制了知識工程語言TUILI。TUILI是一個基于謂詞邏輯的人工智能語言,具有自然的說明性知識表示方式,能夠運用這種說明性知識進行多種組合式推理。它將說明性的產生式語言風格和過程性的邏輯程序設計語言風格結合起來,可以動態調用深度優先、廣度優先和最佳優先策略,實行混合的向前和向后推理,在知識程序的模塊化結構、元級推理以及計算功能等方面引進了新的控制結構。根據我們當時掌握的資料,知識表示語言的這種設計理念乃我們首創。TUILI曾被一些氣象臺采用,在當時的反常氣象預報中有了很好的應用。其次,我們做了集成多種技術和工具的大型專家系統開發環境《天馬》。天馬系統是國家七五攻關課題項目,也是當時國內最大的專家系統開發工具包,其規模與文獻中報道的當時國際上最大型專家系統開發工具相當。已經推廣應用在國防和經濟的20多個領域、50多家單位,取得重要的經濟和社會效益,榮獲1992年中科院科技進步一等獎,1993年國家科技進步二等獎。
1990年代,我們做的第二件事情,就是知識的自動獲取和知識系統的自動開發。那時對知識工程的理解,專家們普遍認為知識工程的瓶頸問題和最主要難點就是知識獲取——從專家那里獲取知識。專家知識的來源主要有兩種:專家本人口授和專家提供的文獻資料,這兩種來源都需要通過自然語言的理解這個關卡。眾所周知,完全的自然語言理解太困難了,目前還做不到。于是我們研究并設計了基于類自然語言理解的一套知識自動獲取技術。類自然語言是一種適度規范化的自然語言。給定一篇文章,類自然語言的語義體現在它的關鍵字和關鍵字結構中,關鍵字以外的文字的語義則可以從關鍵字結構的語義推出。例如在句子“血球分為紅血球和白血球兩類”中,“A分為B和C兩類”就是關鍵字結構。計算機從中可以知道A、B、C是三類對象,其中B和C是A的子類,除此之外并不需要明白A、B、C是什么。這就是類自然語言理解的本質。利用類自然語言技術,計算機能夠很快把一本專業書籍變成一個結構化的知識庫,并進而自動生成一個基于知識的應用系統,即通常所說的智能化計算機輔助XX系統,例如ICAI系統(智能化計算機輔助教學系統)。這個方法有利于把ICAI生成技術從手工編制(第一代),用寫作軟件編制(第二代)向基于知識自動獲取的快速生成(第三代)推進。我們曾用這項技術做過一個ICAI系統的自動開發平臺“天蜂”。我們還把這項技術應用于基于知識的應用軟件自動生成,特別是MIS系統(管理信息系統)的自動生成。
進入21世紀,人類對智能科學的摸索逐漸深入。我們又做了第三件事情,就是提出了“知件”概念。在承擔國家攻關任務項目中,我們發現了問題:開發應用軟件時,軟件里面會含有許多領域知識和應用架構,需要軟件工程師和開發人員向領域專家學習不同領域的知識并掌握需求,這個過程是很困難的;再加上開發出來的程序代碼和相關的領域知識混合在一起,很難區分開,不利于開發,不利于維護,也不利于在開發新的應用時重復使用程序代碼和領域知識。
于是2005年,我們提出“知件”的概念。通過“知件”的形式,可以把軟件中的知識含量分離出來,把“知件”作為獨立的、計算機可操作的、商品化的、可被軟件調用的知識模塊。我們研究了“知件”的結構,語義和生命周期模型。提出了一種新的中間件—知識中間件,作為知件和軟件協同操作的平臺。總的來說,我們主張領域知識應該獨立于硬件、軟件之外,使硬件、軟件和知件在IT產業中三足鼎立。我們的知件研究成果得到一些國內外專家的認同和跟進,產生了一系列后續工作。北京大學高可信軟件教育部重點實驗室把知件作為重點研究方向之一。其中金芝教授領導的團隊先后和浙江大學、東北大學合作,研究知件的實現技術及其推廣應用,取得一系列成果并獲教育部科技進步一等獎。
從今年開始我們做了知識工程的第四件事情,就是大數據知識工程。國家重點研發計劃“云計算與大數據”重點專項——大數據知識工程基礎理論及其應用研究啟動,項目首席科學家、合肥工業大學研究團隊學科帶頭人吳信東教授邀請我們參加。我支持吳教授關于從大數據獲取大知識的思想,重點研究了大知識的內涵界定,并且提出了大知識工程的主張,有關研究正在進行中。
記者:據了解,您曾研究并主持實現了一套全過程計算機輔助動畫生成技術,在藝術創造領域內推進了人工智能。能不能具體就這方面談談。
陸汝鈐:計算機輔助動畫生成技術是從1990年開始做的,那個時候我特別喜歡看動畫片,這帶給我兩個很深的感受。一是國內的動畫片市場基本上都被國外動畫片占領,二是動畫片開發周期長,費用高昂。我發現利用計算機技術可以推進動畫片生產的自動化,人工智能在其中就大有可為。這是人工智能技術的重要試金石。我設計并主持實現了一套全過程計算機輔助動畫自動生成技術,其特點是從受限自然語言理解開始,把中文童話故事自動轉換成動畫片,使計算機模擬腳本改編、電影導演和攝影師的功能。
從1990年到1995年,我們基本上走通了這條技術路線,開發出動畫自動生成軟件《天鵝》。該軟件接受以受限中文自然語言形式輸入的兒童故事,首先是自然語言理解,其次是故事情節的理解和分析,涉及到故事的主角、配角、線索、主題思想等,都要進行分析。再就是各種各樣的規劃,包括情節規劃、角色規劃、場景規劃等,再加上導演規劃,布局規劃、攝影規劃等,每一層規劃都產生新的故事表示,最后轉換成匯編格式的腳本語言程序,由商用渲染軟件生成可放映的動畫片。到1995年,就有了第一個自動生成的動畫片——《三兄弟》,曾在中央電視臺少兒節目《大風車》中播出。剛開始時技術比較簡單,人物也是木偶型,沒有表情,到后來《后羿射日》就有配音和表情,技術有了很大的改進。
2000年,我們跟北京工業大學合作,建立了動畫實驗室,張松懋研究員主持做了兩項研究。一個是將全過程計算機輔助動畫自動生成技術應用于中國古建筑領域,利用動畫形式把古代建筑的施工過程再現出來。經過艱苦的學習,學生們硬是把宋代官方建筑的規范《營造法式》改編成知識庫,已經完成的《天燕》系統可以自動生成180種不同的古建搭建過程動畫。另一個就是做手機動畫自動生成,把它作為手機應用軟件,可以自動理解短信內容并生成相應的短動畫,和短信一起發送。其實我認為動畫自動生成技術有著很大的應用潛力,像電子游戲,虛擬現實,慕課教學等都是應用動畫自動生成的好方向,甚至于充滿符號,非常難懂的體檢報告也不妨以動畫的形式來解釋其內容。當然,動畫自動生成想要真正成為成熟商業模式,還需要努力研究,還需要人力、財力的投入。
陸汝鈐院士題字
創新來自漫長的積淀
記者:在推進人工智能的研究和應用過程中,我國目前發展狀況如何?與世界先進國家存在的差距有多大?
陸汝鈐:我可能是過于埋頭在具體研究工作中了,對整個學科宏觀發展的關注不夠。但我最近看到國外公司的一份調研報告,他們根據對國際上855家其業務內容涵蓋人工智能十三大類方向的企業進行調研的結果,用不同深淺的顏色在地圖上標識這些人工智能企業在全世界的分布和實力。由于顏色的深淺變化是連續的,直觀上只能粗略地劃分成三個梯隊,第一梯隊是美國和西歐部分國家,第二梯隊是加拿大,澳大利亞和印度,第三梯隊才是中國、俄羅斯等,當然這種總結不可能是全面的,但由此多少能看到一些差距。
談到我國人工智能目前的發展狀況,我的觀點是,做人工智能要么在做實上下功夫,要么在創新上下功夫。以機器人為例,常見展覽會上有些機器人外表很漂亮,能唱會跳,非常會抓眼球。但我覺得能夠在復雜地形上負重行軍的機器“大狗”更令我感興趣。我相信后者的難度要大大超過前者。另外,技術創新要從源頭開始,阿爾法狗的下棋過程給人很深的印象:傳統的下棋程序局限于逐步計算每步棋帶來的棋局變化,從而受困于復雜性陷阱,而阿爾法狗能夠以計算機擅長的圖像識別來模仿人類棋手對棋盤上雙方棋子形成的“勢”的判斷,這就是源頭的創新。最后,我想指出,世界各國的普遍做法是:許多新技術最早都是在軍方、在國防里應用,然后再轉民用。相信我們國家也會用人工智能加強國防實力,許多成果只要國防用上了,民間遲早也會用上。
記者:您對人工智能技術在家居里的應用,包括對電器家居智能化有什么看法嗎?
陸汝鈐:在這方面我沒有做過研究,我想說的是,判斷人工智能技術是否真正在家居里應用,要看家人能否自己設計和自己編程家電控制程序,讓家電能聽懂我們說話,能觀察我們的手勢和臉色。家電應該滿足人們的個性化、特性化的需求。我相信將會出現具有醫療功能的佩戴式計算機,根據實時測到的老人或孩子生理指標,如血壓、脈搏、體溫,甚至腦電波活動等主動調節住房環境以利健康。我也相信未來房地產商在蓋房子時,會把電器家居智能化提前考慮進去,這樣人工智能技術在家居里的應用會更廣,前景也會很美好
記者:在科研領域,您獲得了很多的榮譽和重大獎項。如中國計算機學會終身成就獎等,您對現在的年輕科研人有些怎樣的建議?
陸汝鈐:我曾在為凌曉峰教授和楊強教授合寫的《學術研究你的成功之道》一書的序言中談到過“科研年輕人如何做好研究”這個問題,此處摘引幾句。
一個人步入研究生階段,不意味著他將來一定要終身從事科研事業。他可以從政、從商、從軍、從教、從工、從農,在國企、外企,干哪一行都行。因為,社會各行各業都需要具有豐富學識的高智商人才。但有一點,在研究生期間,就一定要認真學習,努力鉆研,心無旁騖,培養起比較強的獨立科研工作能力。這種能力可能在任何行業都能發揮作用。
一個人的價值觀是很重要的。研究生做研究,就像工人務工、農民務農、學生學習、軍人衛國一樣,是自己的本職工作,科研年輕人應該有這個基本的義務觀。
其次,年輕人做研究一定要有創新精神和創新意識。創新是科研工作的核心和靈魂。尋找創新點就是尋找以前沒有人做過,或可能沒有人做過的,有可能成為突破點的新理論、新技術。事實上,許多開創性的工作都是建立在跟蹤的基礎之上。一般都是先有跟蹤,后有創新。我們要提倡為了創新而跟蹤,不是僅僅為了寫幾篇論文而跟蹤。
科研年輕人在選擇一個科研題目時,不妨優先考慮那些在簡單情況下已經有解,而在復雜情況下尚未解決的課題。
每個成功的科研人,都會在專門的領域中,具有科研實力并形成影響力。科研年輕人要沉下心去搞科研,要有探索難題的勇氣,長時間磨煉自己,腳踏實地去做好學問,做深研究,同時,掌握過硬的真功夫。有付出自然就會有回報,我相信,隨著時間的積累,就一定能在業內產生影響,也會收獲到成功的喜悅和快樂。
陸汝鈐院士
來源:高科技與產業化