來源:中國科技網-科技日報
[導讀] 大數據理論的出現,給傳統建模仿真學科帶來了挑戰。“仿真界應該擁抱大數據。”中科院軟件研究所研究員曹建文稱,因為大數據的出現,對解決復雜系統模擬提供了一個非常好的基礎。
原標題:仿真遭遇大數據是挑戰還是機遇
■將新聞進行到底
全球信息總量每兩年就增長一倍左右,2011年全球被創建和被復制的數據總量有1.8ZB(相當于18億個1TB的移動硬盤),預計到2020年全球所管理的數據將達到35ZB。
大數據時代翩然而至。隨著智能手機以及“可佩帶”計算設備的出現,我們的行為、位置,甚至身體生理數據等每一點變化都成了可被記錄和分析的數據。被譽為“大數據商業應用第一人”的維克托•邁爾•舍恩伯格在《大數據時代》一書中指出,大數據時代最大的轉變就是放棄對因果關系的渴求,轉而關注相關關系。
近日,在中國科協舉辦的第81期新觀點新學說學術沙龍上,多位科學家圍繞大數據時代從“求因果”到“相關聯”的革命性轉變,以及大數據對仿真建模的挑戰與思考等話題展開觀點交鋒。
大數據顛覆思維慣例
美國航空航天局(NASA)為何能提前預知各種天文奇觀?如何才能準確預測并對氣象災害進行預警?未來城鎮化建設中,怎樣打造智能城市?這些問題背后,暗藏著大數據的身影和巨大價值。
何為大數據?大數據指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理,并整理成為幫助企業經營決策更積極目的的資訊。目前公認的大數據具有“4V”特性,即Volume(規模性)、Variety(多樣性)、Velocity(高速性)和Value(價值性)。
“大數據帶來了全新的思維和方式,我更注重它對思維的改變控制。”中國系統仿真學會副理事長、國防大學教授胡曉峰說,大數據的革命特性體現在從局部到全體、從單純到繁雜、從因果到關聯、從簡單到深入4個方面。
其中,大數據從因果到關聯這一特性備受爭議。“其最重要的思想是放棄對事情原委的追究,而代之以對相關性的接納,因此它更適合回答‘是什么’,而不是‘為什么’。”胡曉峰直言,海量數據的相互關系已經可以產生新的發現,這完全顛覆了牛頓、愛因斯坦體系下因果關系的思想。如今,美國和歐盟已啟動如“大腦掃描計劃”“星球皮膚計劃”等相關研究計劃。
“如果只是輕信大數據告訴我們的一些東西,而這些東西還不告訴你為什么會這樣,這個世界將會變成怎樣?”解放軍理工大學指揮信息系統學院教授張宏軍認為,大數據面臨的最嚴重問題,就是不能解決因果問題。
在國防大學信指部教授吳琳看來,因果關系的研究促進了科學體系的建立,科學研究的目的之一就是要發現因果關系,“如果說大數據研究不在意因果關系,是不是我們整個科學的基礎要重新定義?”
從大數據的發展現狀來看,主要應用體現在企業界和工業界。吳琳進一步質疑,對企業來說,只要有利潤就行了,可以只要現象不要理由。但是,對飛機的控制和病人的救治是否可以依賴不精確、不知因果的數據并做出相應反饋?
“因果關系和關聯關系分析應互為補充。”中科院數學與系統科學研究院研究員呂金虎稱,大數據的價值在于數據之間的相互挪用和關聯,深度分析和挖掘就會產生新價值、新知識。
——挑戰——
現有仿真技術難處理大數據
大數據的采集、存儲、傳輸、處理、應用等問題,對各行業的文化、組織、管理、方法、技術等均提出了挑戰。美國科學院發表研究報告指出,計算機仿真技術已與理論和試驗并列為進行科學研究的第三支柱。仿真是從模型到數據,而大數據則是數據到模型。那么大數據的出現,又給仿真科學帶來怎樣的沖擊?
“大數據理論的出現,給傳統建模仿真學科帶來了挑戰。很多問題需要我們認真研究和討論,這些挑戰有可能會動搖或變革原仿真理論的基礎。”胡曉峰舉例說,美國一個大學生課外作業研究本拉登到底藏在哪里,做了一個模型出來并在網上到處搜集數據,最后抓到本拉登的地方和這位學生建立模型的距離,只相差100多公里,而他利用的方法叫做生物物理信息學。“這個模型是利用現實數據搜索來完成的,這種試驗結果越來越趨近于真實。”
專家們一致認為,大數據對建模仿真的挑戰主要體現在思維方式、科研方式和方法手段等方面,利用現有建模仿真技術處理大數據還存在問題。比如,傳統的仿真思維方式認為仿真是基于模型的活動,其科研方式是根據系統實驗的目標建立系統模型,進而建立仿真系統運行系統模型,最后再分析、處理模型運行結果。“但傳統的仿真思維方式和科研方式,已不適應處理大數據的需求。”中國工程院院士李伯虎坦言,現有的建模方法不能建立相應的系統模型,并關聯和處理這些大數據;現有的仿真支撐方法手段不能適應對分布、異構復雜系統大數據感知、采集、挖掘、處理、應用的需求;現有的仿真應用工程技術對復雜系統產生的大數據,還不能全面、充分、及時地用于各行業,并推動社會發展……
——機遇——
大數據為仿真應用發展添翼
美國麻省理工學院教授艾瑞克認為,大數據的影響就像4個世紀前人類發明了顯微鏡,把對自然界的觀察和測量水平推進到“細胞”級別。2011年,英國《科學》雜志推出專刊圍繞“數據洪流”展開討論,將大數據深度分析看成未來研究重要突破點;奧巴馬政府2012年3月發布“大數據研究與發展倡議”,作為未來發展戰略……
李伯虎認為,大數據對于作為科學研究第三種范式“計算科學”中重要組成部分的“仿真科學”來說,不僅僅是挑戰同樣還有機遇。
“仿真界應該擁抱大數據。”中科院軟件研究所研究員曹建文稱,因為大數據的出現,對解決復雜系統模擬提供了一個非常好的基礎。
對此,上海大學機電工程與自動化學院教授費敏銳表示贊同,并推斷“大數據必將成為復雜系統仿真建模的一個新方法。”雖然大數據處于初步階段,但其在生命科學、社會科學等領域的作用將逐漸顯現。
“大數據可以為我們提供一個解釋不明現象的新穎視覺。是擴充了仿真科學方法,還是獨創了新的科研范式?”在胡曉峰看來,大數據提供了一種繞開理論直接走向應用的新途徑,挑戰了“觀察—假設—實驗—應用”的科研流程,找到了可以避開建模而直接獲得答案的方法。此外,大數據還帶來了許多值得研究的科學新問題,比如對預測問題的思考。
然而,大數據的真實價值有如潛伏在海洋中的冰山,我們看到的只是冰山一角,絕大部分都隱藏在表面之下。
“如果沒有梳理信息特征的新型分析工具,人們難以在大數據中檢測到有價值的信息。”中國電子集團電子科學研究院研究員王積鵬說,大數據建設的智能化應用是體系仿真的根本,包括數據的采集、整理、分析、評估和應用,目前缺乏一些基礎數據的收集整理。他建議:“推進仿真工程研究,應主要加強數據的存儲和認知分析等技術的協同應用,重點加強數據挖掘和預測分析應用。”
“將大數據方法與仿真建模方法融合,將為仿真技術與應用發展帶來嶄新的機遇。”李伯虎院士說,大數據的出現提供了更為高效的研究模式和手段,將革新現有仿真的思維方式和科研模式,要建立從大數據獲取知識的理念;革新現有的建模方法學,從傳統的建模方法拓展到基于大數據的建模方法;革新現有的仿真支撐技術系統、仿真系統和仿真應用工程技術等。
本篇文章來源于: 中國科技網 www.stdaily.com