在聯合國公布的17項可持續發展目標的169個具體指標中,39%的指標雖有方法論和路線圖,但缺少數據依據幫助落實;16%的指標既缺少方法又缺少數據。中國科學院院士郭華東在國際數據委員會(CODATA)2019年學術大會上,分享了這樣一組數據。
“大數據對實現可持續發展目標至關重要,而良好的數據共享機制可以把全世界的科研人員凝聚在一起。”郭華東說。
近日,國際數據委員會(CODATA)2019年學術大會在京召開。圍繞“邁向下一代數據驅動的科學:政策、實踐與平臺”主題,學者針對數據基礎設施能力建設、數據開放的政策和實踐、數據驅動科學發現的案例等展開了研討交流。
“隨著科學研究進入大數據時代,世界各國對科學數據的重視達到了前所未有的高度。”CODATA中國委員會副主席、中國科學院計算機網絡信息中心主任廖方宇說。
2018年3月,國務院辦公廳印發《科學數據管理辦法》。今年6月,科技部、財政部在前期科學數據工作的基礎上,在高能物理、基因組、氣象、地震海洋等領域組建了20個國家科學數據中心。其中11個國家科學數據中心是依托中科院高水平研究所建立的,中科院計算機網絡信息中心承擔了國家基礎學科公共科學數據中心和中國科學院科學數據總中心的建設、運行和服務職責。
中國科學院副院長、中國科學院院士李樹深指出,科學數據的豐富度、關聯性與開放性將成為21世紀驅動科技創新的核心要素。繼“觀察實驗”“理論分析”“計算模擬”之后,“大數據驅動科學發現”已成為科學研究的第四范式。
中科院作為國家自然科學最高學術機構,歷來重視科學數據的管理與應用。上世紀80年代中科院啟動了科學數據庫建設項目,并從“十五”開始通過中科院信息化發展專項全面提升科學數據資源高效匯聚、集成管理和深度應用服務。發展至今,已形成了以國家重大科技基礎設施、野外臺站監測網絡、大型觀測實驗平臺等為代表的空天地海立體化科學數據生產網絡。打造出的以“中國科技云”為代表的新一代科學數據基礎設施平臺,可為EB級科學數據提供傳輸、存儲、分析、處理的一體化云服務,可開放共享的數據量已達到數十PB;部署的物質科學、天文學、空間科學、海洋科學、生態系統、地球環境等領域的學科數據應用平臺,在重大科學發現及決策支持中發揮了重要的作用。
CODATA主席Barend Mons在講話中提到,科學數據的發展機遇與挑戰并存。隨著海量且多樣化的科學數據不斷產生,機器智能化處理和使用數據的能力亟待提升,機器學習和人工智能等新技術將發揮越來越重要的作用。除了技術問題,人為因素也起關鍵作用。
科技部國家科技基礎條件平臺中心主任蘇靖表示,期望通過中外科學家的不懈努力,進一步推動全球范圍內更加廣泛的科學數據開放與合作交流,助力更多具有世界領先水平的重大科學發現和原創性的技術突破,推動全世界科技創新能力和經濟社會的發展。
摘自《中國科學報》