鄔賀銓
■本報記者 陸琦
“大數據挖掘對智慧城市的經濟發展和社會管理是無形的生產資料,大數據價值的合理共享和利用將創造巨大財富。”中國工程院院士鄔賀銓在1月11日舉行的2013中國智慧城市年會上說。
鄔賀銓認為,智慧城市是城鎮化進程的下一階段,是城市信息化的新高度,是現代城市發展的愿景。智慧城市在產生大數據的同時,大數據也支撐著智慧城市的建設和發展。
何謂大數據?鄔賀銓援引維基百科的定義說,大數據指沒有辦法在允許的時間里用常規的軟件工具對內容進行抓取、管理和處理的數據集合。
大數據目前的標準是,單一數據集的大小在幾十個TB(萬億字節)和幾個PB(千萬億字節)之間。
大數據究竟有多大?比如,淘寶網每天交易達數千萬筆,其單日數據產生量超過50TB,存儲量超過40PB;百度每天大約要處理60億次搜索請求,數據量達到幾十PB;中國聯通用戶上網記錄達每秒83萬條,即每月1萬億條,對應數據量為每月300TB。
“大數據雖然孕育于信息通信技術的日漸普遍和成熟,但它對經濟社會生活產生的影響絕不僅限于技術層面。”
鄔賀銓舉了幾個有趣的例子。美國印第安納大學利用谷歌提供的心情分析工具,從網民的上千萬條留言中分類出6種心情,進而對道瓊斯工業指數的變化進行預測,準確率達到87%。又如,美國Target超市選出孕婦常常購買的25種典型商品,建立“懷孕預測指數”,針對性地派送孕婦用品優惠廣告,正因為利用了大數據分析技術來細分客戶群,2002年到2010年間,其銷售額從440億美元增長到670億美元。
此外,利用搜索關鍵詞,疾控部門可以預測、判斷某地流感暴發情況;通過關注社交網絡上“糖友”的交流與感悟,醫院和醫生可以獲得更好的糖尿病診療和康復經驗……鄔賀銓表示,大數據的應用領域很廣泛,在醫療健康、財務管理、物流管理、國土安全等各個領域都有巨大的利用空間。
“物聯網也好,智慧城市也好,數據挖掘是重點。”鄔賀銓說,“獲得數據后,不是簡單的數據分析,還需要建立模型進行仿真,得出直觀的可視化結果。”
鄔賀銓以太湖藍藻監測為例指出,通過傳感器捕獲太湖水質情況,可以得到溶解氧、水溫、電導率、氨氮、pH值等參數作為參考。但僅僅這些還不夠,還需要結合視頻圖像、人工采集和衛星遙感的數據一起分析。“多源異構的數據才能保證判斷的可靠性。”鄔賀銓說。
收集到各類數據之后,到后臺進行分析挖掘,建立模型,跟歷史數據進行對比,同時利用3S技術、云計算等,最終實現對污染的處理。
“裝幾十萬個攝像頭,并不表示就是智慧城市。”鄔賀銓直言,“大數據的收集、存儲、分析處理及使用,對智慧城市是很大的挑戰。這不僅是技術也是政策和法律需要關注的問題。”
鄔賀銓說,無線城市、數字城市、寬帶城市、感知城市都是智慧城市的必要條件,創新城市、綠色城市、宜居城市、平安城市、健康城市、幸福城市等更是智慧城市的應有之義。
《中國科學報》 (2013-01-17 第1版 要聞)