“相對于采集、儲存,數據挖掘才是大數據走向應用創造價值的關鍵。貴州在拼命開放數據的同時,也在全力進行數據挖掘,就是要盡快’逼出’大數據的價值,讓大數據戰略釋放出大紅利。”近日,2017中國國際大數據挖掘大賽在貴州啟動,該賽事組委會一位負責人在會上表示。而作為我國首個大數據試驗區,貴州僅是全球大數據浪潮的一個縮影。
浪潮之下,中國西部、美國硅谷有了合拍動作——挖掘數據。伴隨數據資源的開放,挖掘工具的進步,商業前景的清晰,數據挖掘成為新一輪市場熱點,愈發受到資本的追捧。
追捧背后,是一堆毫無交集的數據,經過一番交融薈萃,催生出全新應用和商業模式,孕育出新產業和新的經濟增長點,傳統經濟活動被顛覆……以數據挖掘為核心的大數據價值輸出新時代,正在趨近。
經濟變革新引擎
大數據鏈條劃分,目前國際主流做法是分為數據獲取、預處理、存儲、挖掘或分析、可視化五個關鍵環節,挖掘被認為是核心。
中科院院士、北京理工大學副校長梅宏表示,真正的大數據就體現在大數據的深度挖掘應用。
一位曾參與國家大數據行動計劃綱要起草的專家也認為,如果把大數據比作石油,那么挖掘就是勘探、鉆井、提煉、加工。核心是把數據資源變現成商用價值。該專家表示,數據資源已經成為國家戰略性資源,我國必須盡快在大數據挖掘這個關鍵點有所突破。
該專家分析稱,以前是對于數據資源的利用,更多是信息的獲取,例如企業通過經營數據的分析統計,總結過去的經營活動。而現在不再局限于信息獲取,同時實施數據資源的挖掘,可以優化業務模塊、催生新的業務模塊,這是顛覆性變化。
全球知名咨詢公司德勤此前發布的《2016分析趨勢報告》稱,數據挖掘的威力和價值正在凸顯,助推人們決策的更明智化,優化企業和社會運轉,而商界正在積極尋找可以使其贏得優勢的科學方法。
專家認為,當前已走進數據價值輸出的時代,“大數據依靠挖掘而呈現的巨大商業價值,正在成為推動經濟變革的新引擎。”
政府數據亟待更多開放
數據挖掘的前提在于數據源豐富。德勤最新發布的《2017德勤技術趨勢》指出,數據資源正在指數級的增長,到2020年,全球的數字預計將達到44澤字節。
數據資源呈指數級增長的同時,其開放和共享程度也亟待提升。中國信息通信研究院互聯網法律研究中心主任工程師楊筱敏表示,從國際上看,政府數據開放還處于初期階段,主要通過制定戰略或政策文件形式指導開放。
楊筱敏介紹說,2015年我國密集發布了多個相關文件,其中最主要的是國務院發布的《促進大數據發展行動綱要》,對相關政策進行了梳理,提出在開放前提下加強安全和隱私保護,在數據開放的思路上增量先行,在2018年底前建成國家統一的數據開放平臺。
據了解,嗅得商機的先行者已多有行動。包括貴州、寧夏等省區,早在幾年前就開始布局大數據。貴州甚至是全國第一個大數據綜合試驗區,政府數據開放是其重要的試驗內容。
貴州在2014年開始大數據行動,第一步就是打造一個數據開放共享的“聚通用”云上貴州平臺。2016年下半年,貴州突然加大推進力度,啟動“數據’聚通用’攻堅會戰”。
貴州省大數據發展管理局副局長康克巖介紹說,2017年元旦前夕,貴州省法人單位、人口、空間地理、宏觀經濟等四大基礎數據庫數據匯入共享平臺,率先實現50%以上政府數據“云上”開放共享。
事實上,更多的地方政府也意識到數據開放的必要性和緊迫性。目前,北京、上海、浙江、青島、武漢等地已建立了專門的政府數據開放平臺。近期,河北省和安徽省均表示要在2018年底前初步建成政府數據開放平臺。
據了解,在上述大賽啟動會上,來自貴陽、北京、上海、深圳、廣州、杭州等17個國內政府數據開放先行城市的代表,共同發布了《共同促進數據開放及應用行動宣言》,呼吁共同努力促進政府數據開放。
搶占風口制高點
在分享貴州數據開放經驗時,康克巖表示,在進行海量數據匯集過程中,有一個難題就是數據格式不統一、標準不統一。
形態各異的數據正是大數據的顯著特征。海量的圖片、聲音和視頻甚至互聯網上的閑言碎語……《2017德勤技術趨勢》將這些非結構化的數據稱之為暗數據,并認為這些暗數據是比以往任何時候都更有價值的數據源。當然,對挖掘技術的要求也越來越高。
移動信息化研究中心近期發布的《2016中國大數據市場研究報告》顯示,國內大數據企業此前主要聚焦在技術壁壘較低的應用、可視化等環節,而在存儲和挖掘等環節極少有企業切入。但是,2016年看情況發生了變化。該報告顯示,2013-2016年,數據挖掘在大數據產業鏈中的分布情況從4.1%上升到9.2%。這意味著越來越多大數據企業和數據科學家加入到“暗數據挖掘”戰。
與此同時,該報告顯示,從大數據主要產業鏈市場份額占上看,數據存儲約占12.5%,存儲14.7%,應用7.9%,挖掘占比最高,為17.3%。《報告》認為,產業鏈縱向各環節均屬藍海市場,而挖掘高風險與高收益并存。
對于數據挖掘,麥肯錫顯現出積極態度。麥肯錫全球研究所一份報告指出,到2025年,物聯網11.1萬億美元的年產值中60%將來自于對數據的整合和挖掘。
國內資本也看好大數據挖掘市場,多數大數據創新企業在A輪或A輪以前可以融到數千萬元的啟動資金,在極大程度上催熟創新企業的成長。
知名風投看好,作價千萬提前布局,其中不乏有IDG資本、經緯中國、達晨創投的身影。例如,聚焦于數據挖掘的昆侖數據曾獲得達晨創投數千萬元的A輪融資。
資本熱捧下,人工智能(AI)、深度學習等大數據挖掘技術和工具的概念也呈迸發之勢。尋找新的挖掘技術和工具,成為搶占大數據風口的制高點。
“這亦是上述大賽聚焦點之一。”上述大賽組委會負責人士表示,2017中國國際大數據挖掘大賽聚焦數據挖掘及應用,清晰展現大數據價值路徑。
摘自《中國高新技術產業導報》