《經濟日報》,2014年3月17日
編者按 作為國家科技創新體系的重要組成部分,國家重點實驗室是國家組織高水平基礎研究和應用基礎研究、聚集和培養優秀科學家、開展高層次學術交流的重要基地。自1984年啟動國家重點實驗室建設計劃以來,我國已有約300個國家重點實驗室投入運行。這些實驗室是如何開展創新性研究的呢?為此,本報派出記者,走進10個國家重點實驗室,讓讀者了解它們背后的故事。
模式識別國家重點實驗室是這組系列采訪的第一站。它籌建于1984年,1987年正式對外開放并通過國家驗收,是首批國家重點實驗室之一。
打開市場大門
墻上掛著一幅畫,有人從墻邊走過,取下畫框。
嘀嘀嘀!尖利的報警聲響起,監控室的顯示屏上,這幅畫所在的監控視頻從數十個視頻中脫穎而出,瞬間被電腦挪至屏幕中心并放大,墻上放置畫框處被加上了一閃一閃的紅框,畫框被人取走的那一小段鏡頭被反復重放。
“這可以用于博物館畫展防盜,是視頻識別技術在安保領域中的應用。”中科唯實科技有限公司總經理王海濱說,“我們的核心技術來自模式識別國家重點實驗室。”
隨著現代社會攝像頭的普及,平均一個市級城市的攝像頭就有2.5萬個以上,海量數據僅靠人力難以監控,必須依靠電腦輔助挖掘,智能視頻分析系統的市場因此越來越大。“我們競爭的是百億級的市場。”王海濱充滿信心地說。
事實上,在這家公司成立(2012年7月)之前,模式識別國家重點實驗室的視頻分析與監控技術就獲得過國家科技進步二等獎,在北京城鐵13號線得到成功應用。13號線自2002年開通運營以后,電纜線被盜案件時有發生。2007年初,城鐵13號線安裝了智能視頻分析系統,對每個角落進行24小時的實時監控,一接到智能系統的報警信號,安保力量就會及時出動。在幾個盜賊被當場擒獲之后,城鐵13號線近幾年就再也沒有發生過類似案件了。
偷盜、打架?有異常行為分析系統。
公眾場所會否發生踩踏?有人群密度監測系統。
電影中用正常視頻替換掉異常視頻的黑客行為怎么防范?有視頻篡改檢測軟件。
想查明星身上的衣服包包哪里賣?有圖片檢索技術。
如何擴大市場并精準投放產品?可用電腦分析目標人群的行為偏好和行動規律。
……
實驗室博士張俊格的研究方向就是圖像視頻分析,他對這個研究方向充滿信心:“模式識別是大數據技術的核心,十幾年前看不到太多應用,現在應用需求非常大。”
“數據本身沒價值,挖掘數據中的模式才有價值。大數據時代,模式識別很重要。”中科院院士譚鐵牛表示,幾十年前國家就在這個方向設立重點實驗室,具有超前的戰略眼光。
堅持國際水準
模式識別實驗室的國際范兒很濃厚:早在1997年就成立中法聯合實驗室,后來擴展成中歐聯合實驗室;早在2001年就有一位來此做博士后、后來成為實驗室正式員工的法國女士普林特申請到我國的國家基金項目,成為外籍科學家申請國內科研項目的第一人;有19人次擔任模式識別領域一些重要國際學術組織的職位。
頻繁的國際交流與合作,昭示了模式識別實驗室堅持國際水準的雄心壯志。要建設世界一流實驗室,“頂天”的國際水準和“立地”的成果應用缺一不可。
虹膜識別,就是實驗室中非常有代表性的一個“頂天立地”的技術。
虹膜是人眼瞳孔和眼白之間的環狀組織,包含了豐富的紋理信息,是人體中最獨特的結構之一。虹膜識別技術是目前精確度最高的生物識別技術。
模式識別國家重點實驗室的虹膜識別技術在國際上名列前茅。眼睛半睜,可以識別;戴上美瞳片,可以識別;甚至3米遠看一眼,也能識別……實驗室的虹膜識別技術參加國際比賽,連續排名第一。這個領域最頂尖的刊物上,關于虹膜識別的文章,近一半出自這個實驗室。他們提出了自己的基礎理論,掌握了數據源頭,參與制定國際標準,并有成功的產業化實踐。
實驗室建成的虹膜圖像數據庫是國際上目前規模最大、使用最廣的共享虹膜圖像數據庫,有來自100多個國家和地區的8000多個研究團隊使用。美國國家標準研究院曾在公開報告中表示,中科院自動化所發布的虹膜圖像數據庫推動了國際虹膜識別研究的發展。
如今,實驗室自主研制的人臉識別和虹膜識別技術已經成為國產生物特征識別產品的核心技術來源,有11項虹膜識別專利的所有權成功轉讓給北京中科虹霸科技有限公司。在2006年成立這家公司之前,中國虹膜識別的市場都被日本松下、韓國LG壟斷,國產技術推出之后,打破國外壟斷,產品價格至少下降了三分之二,中科虹霸公司如今已占據了國內80%以上的虹膜識別市場份額。
實驗室的虹膜識別技術不僅占據國內市場,還通過技術授權在國際上首次大規模實際應用于銀行ATM機。
寄望基礎創新
如今,實驗室做出的包括人臉識別和虹膜識別技術在內的新一代生物特征識別系統,已在奧運會、世博會、海關、銀行、軍隊、公安、煤礦等領域取得實際應用。
作為國家重點實驗室,模式識別實驗室還建立了人臉數據庫(2D和3D)、虹膜數據庫、掌紋數據庫、語音語料數據庫、步態數據庫、手寫文字數據庫等15個大型數據庫,并免費提供學術界共享。這么多數據庫,其實也反映了模式識別研究領域的復雜性。
作為信息科學和人工智能的重要組成部分,模式識別牽涉的學科很多,與數學、統計學、心理學、語言學、計算機科學等都有關系;它研究的對象更多,要讓計算機會看、會聽、會說、會思考,就要讓電腦像人腦那樣分析和識別文字、圖像、視頻、音頻……
在如此紛繁的頭緒中,實驗室的重點發展方向是什么呢?
剛剛就任模式識別國家重點實驗室主任的中科院自動化所研究員劉成林表示,實驗室未來的主要研究領域和研究方向不變,即模式識別基礎、圖像處理與計算機視覺、語音語言信息處理。“我們在部分方向上,如虹膜識別、文字識別、機器翻譯是領先的,這些我們還將繼續保持。在模式識別基礎理論方面,如機器學習、視覺計算基礎等,我們有一些零散的成果,但沒有形成大的學術影響,還需要重點投入力量開展原創性研究。”
在模式識別領域,各種識別問題的核心都是模式分類。目前模式分類的基本理論和方法,主要有統計分類器、神經網絡、支撐向量機、Boosting、稀疏表示等,這些國際上常用的模式識別理論和方法大多為國外科學家首先提出。
“新的理論方法有可能提高所有模式識別任務的準確率,并在國際上產生重大學術影響,我們現在缺乏這方面的工作。”劉成林說,要產生這樣的成果,需要吸引這方面最好的人才,給予穩定的支持。“至少穩定10年以上,就可能出很好的東西。我們考慮將國家重點實驗室的專項經費向基礎理論研究傾斜。”
術有千變,道法歸一。我們期待著,模式識別實驗室能早日實現基礎理論的突破,實現電腦與人腦之間的無縫銜接。