來源: 中國科技網 作者: 王怡
依然漂泊在外的斯諾登讓美國“棱鏡門”事件懸而未決,也使得“大數據”“云計算”這兩個時髦的詞匯以一種并不光彩的方式出現在人們的視野中。
“棱鏡”計劃通過對美國九家主要的互聯網公司所掌控的用戶的音頻、視頻、郵件等10類信息進行數據及文本的挖掘,從而分析出個人的聯系方式以及行動。值得注意的是,“棱鏡”每天所要面對的天量的“10類信息”便是標準的“大數據”。在網絡以及媒體對“棱鏡門”進行鋪天蓋地的口誅筆伐以及對爆料者最終去向不斷猜測之時,探討大數據能為我們帶來什么似乎更有意義。本報記者特就它影響我們生活的方方面面,采訪了有關專家,同時推出上下輯,探討與大數據有關的那些事兒。
不僅“大”,與之配套的分析能力更“強大”
在提到大數據這一概念時,微軟云計算中國區總監沈寓實特別強調:“我們所說的大數據,并不只是數據‘大’這一概念,這是信息和資源兩個概念的區別,數據可以看作是信息,大數據則是可以用來分析和參考的有效資源。”
大數據的“大”一方面是數據絕對數量的急劇增長。IBM全球副總裁胡世忠在IBM2013大數據與分析高峰論壇上談到:“十年前我們把一些數據量做GB,現在數據每個月發生變化,我們把它達到PB的數量,每天差不多25個PB的數據。”
在計算機世界中1PB是1024TB, 1TB又是1024GB。為何在大數據的時代,數據出現了這般爆炸式的增長?這就要提到大數據的“大”的另外一層含義:更廣的信息范圍。
IBM全球企業咨詢服務部大中華區總經理段仰圣談道:“企業數據,實時數據還有社交媒體的數據都包括在大數據范圍內。我們的購物記錄,在搜索引擎上的搜索記錄被整合起來后都可以成為有用的數據。也就是說,我們在真實生活以及社會交往的過程中的點點滴滴都可以被‘數據化’。很多數據,比如社交媒體的數據是以文本的形式存儲,這也一定程度上體現了信息范圍的擴大也是數據絕對數量增長的重要原因。”
正如沈寓實所說,大數據并不是簡單描述數據數量的龐大與來源的廣泛,它更強調的是與之相配套的強大的分析能力。沒有從天量數據中披沙揀金的分析能力,空有龐大的數據只會變成“數據墳墓”。
胡世忠簡明扼要的把上述大數據的特點描述成4個“V”,V代表了數據的數量、速度、多樣性、真實性。這四個V涵蓋了大數據最主要的方面:數據量大,數據來源廣形態多,分析數據速度快能力強,來源真實。
未來,生活點滴都被數據化
大數據到底會帶給我們什么?記者采訪的幾家從事大數據研發的公司,都在從事著與智慧城市相關的大數據研發。
天云大數據正在依照紐約311熱線項目,為北京政府了解民情提供參考。
“我們通過收集到的碎片信息,進行綜合分析,依據實時監測公共數據,聚會分類各種相關民情,對數據進行提煉分類和可視化,”天云大數據副總裁雷濤介紹說:“在對北京東城區進行智慧城市網格化管理的民情播報:公共衛生,公共安全,環境設施,社區養老,緊急事件民……通過實時監控與分析,政府可以實時了解民情,并針對不同功能區域結合市民反映狀況進行合理改善與治理。”
雷濤介紹說,紐約市民把311熱線看成是生活的百科全書,包括報稅、流感注射、手機賬單,出租公寓、寵物執照,以及游泳池、公園、圖書館、體育場等信息。而311熱線所登錄的來電內容,也反映出紐約市民生活百態。
311熱線讓市政當局充分地了解民情,正因為投訴電話太多,紐約市長則針對噪音問題破天荒地對紐約的狗吠修法,狗白天吠叫不可超過十分鐘,但若是在晚間,不得超過五分鐘,主人如不能在規定時間內使狗平靜下來,將會因違反噪音管制法吃上罰單。至于全美國行之有年的冰淇淋販賣車,各地都是播放傳統的童謠音樂,這童謠形同冰淇淋車的標準音樂,但是因不少民眾投訴音樂吵人,于是紐約市長規定冰淇淋車子不得播放童謠,僅能以手搖鈴來招攬客人。
“紐約,這個美國最大的城市擁有820萬人口,每天產生大量的數據,其中大部分數據位于很多市政機構和部門的高度分散的孤島中,如何有效的利用就成了解決問題的關鍵,”雷濤說:“大數據不僅僅能為企業所用,還可以幫助政府了解民情。大數據技術不僅僅可以替代傳統信息系統,更重要的是大數據擁有前所未有的計算能力,語義計算,行為計算,視覺計算,可以得心應手的處理以前難以處理甚至無法處理的數據。”
IBM全球副總裁兼大中華區軟件集團總經理胡世忠也就大數據如何解決交通問題提出了自己的設想。
“北京的交通問題是非常大的,如果可以提供一些數據的分析,讓這個城市能夠更好地了解在一天的什么時間,有很大的公共交通的情況,或者在某一個時間某條公路上的一些情況,這對于我們物流方面的交通有很大幫助。以此類推,對于政府來說,比如水資源的管理,電網的管理,在大數據的分析之后,都將有一個完美的管理方式。”胡世忠說。
怎樣搭上大數據這班快車
——與大數據有關的那些事兒(下)
來源: 科技日報 作者: 姜晨怡
大數據是個好概念。據海外媒體報道,美國市場研究公司Forrester日前公布了一份關于客戶數據管理的研究報告。結果顯示,大數據雖然是不可逆轉的趨勢,但絕不是一劑萬能良藥。在這份名為《未來客戶數據管理之憂患》中提到,分析人士就未來客戶數據分析的前景進行預測,涵蓋諸多重點,其中最受關注的焦點是數據來源問題。隨著移動終端設備的廣泛普及,數據來源變得越來越多元。一方面必須尊重和保護數據擁有者的隱私,另一方面必須對同一個人利用多個移動終端設備發出的數據進行整合。
發展大數據產業必須有明確的產業規劃。事實上,與大數據有關的行業到底有哪些?它會給我們的生活帶來哪些變革?大數據是否又“過熱”了?
海量數據幫廠商賺到更多
事實是,雖然大數據的數據來源缺乏明確標準,安全性也讓人感到隱隱作痛,但這些都并不妨礙大數據在商業領域的成功應用。平臺仍在搭建中,技術也正在探索中,而大數據這個聽起來有些虛幻的概念,已經迅速地幫助廠商得到了更多實惠。
中國互聯網協會副秘書長石現升以農夫山泉舉例介紹,他們每天有一萬個業務員,其中每天每個人要到十五個銷售點拍十張照片,每人每天拍的照片是10兆,一萬個業務員每天的數據量就是100G,每個月就是30T,這些靠最簡單的方式獲取了海量數據,這是農夫山泉大數據量獲取的來源。同時這些照片主要觀察的是各個銷售點怎么擺放,位置發生什么變化,以及這些變化的原因是什么,怎樣擺放水有助于銷售,不同年齡段購買量有多大,氣溫的變化對購買行為的影響,競爭對手的新包裝如何等等對經營帶來直接的指導作用的信息。他們通過與SAP公司合作,采用大數據分析技術對產品和銷售做出快速反應,由24小時縮短至0.67秒,同時提供精準物流服務,物流配送效率得到極大提升,效益提升使市場占有率是34.8%,年增長率達到30%到40%。
在互聯網行業,大數據帶來的變化明顯的一點就是精準的廣告投放。石現升介紹,傳統網絡投放是比較粗放式的網絡投放,但是現在通過搜索廣告營銷的方式,使得廣告投放和用戶滲透更加的精準。用戶看到的是他愿意看到的,投放主投放的廣告,通過搜索的方式把這些廣告內容直接推送到用戶手上,所有一切通過海量數據分析來完成。
大數據帶動更多產業提速
大數據有個陽光明媚的稱號——“新的石油”。這是因為種類廣泛、數量龐大、產生和更新速度加劇的大數據蘊含著前所未有的社會價值和商業價值。事實上,大數據不是個單獨的產業,由它帶動的相關行業還包括:用以實現大數據存儲、檢索、處理、分析、展示的相關IT硬件與軟件的生產、銷售和租賃活動,以及相關信息服務。據賽迪分析,大數據有關行業可分為三個方面:用以搭建大數據平臺、實現大數據組織與管理、分析與發現的相關IT硬件與軟件的生產、銷售和租賃活動;大數據平臺的運維與管理服務、系統集成、數據安全、云存儲等解決方案與相關咨詢服務;與大數據應用相關的數據租售業務、分析預測服務、決策支持服務、數據分享平臺、數據分析平臺等。
藍訊是一家專門做CDN即內容分發網絡的公司,簡而言之,他們的業務就是讓網絡更快更穩定,避開那些影響網絡數據傳輸速度和穩定性的環節。就是這樣的一家公司,已經在大數據的大背景下,規劃著自己的未來。在日前舉行的“中國CDN十五年發展大會”上,香港科技大學計算機教授、藍訊首席技術顧問李波提出,隨著云計算、大數據應用、移動互聯網和社交網絡發展,傳統的CDN服務的內涵也正在發生變化。正在從傳統的互聯網內容加速服務,向針對互聯網資源提供有效管理服務的方向演進。例如如果企業需要一種定制化服務,這些服務包括云計算、大數據、移動互聯網和社交網絡的資源,那么專業CDN公司能不能以最快方式、最合理資源配置方式為用戶提供最為有效服務,這將是CDN服務未來的發展方向。如何面對大數據帶來的種種挑戰,應該是每個處于行業中的公司都應該思考的事情。
■ 多說一句
警惕大數據過熱帶來資源浪費
文•本報記者 王 怡
由于有了之前“云計算”過熱的前車之鑒,現今處在聚光燈下的大數據也應警惕泡沫。中國云基地創始人田溯寧在接受采訪時說道:“云計算和大數據的到來,對中國十分有利,它縮短了中國與世界的距離,中國有可能在這個領域獲得創新和領先。”
大數據或許會改變整個時代的進程,微軟云計算中國區總監沈寓實認為:“大數據時代,數據將會是新能源。”紐約時報曾評論“數據將成為類似貨幣或黃金的新型經濟資產”。面對如此誘人的描述,以及發展中國家在此次競賽中并不差的排位,我們在投入熱情的同時,還要保持冷靜。
中科院計算機研究所副研究員王斌認為:“大數據也許會改變計算機企業的格局,原來主導計算機行業的要么是硬件制造者,要么是軟件制造者,也許以后在計算機行業的主導者是數據的擁有者。”
“但是,真正步入到大數據時代,還需要經歷一個過程。”王斌說。大數據熱對于大數據發展是有益的,但不能防止有的人借此炒作概念用來圈錢。“有的不了解大數據、不懂大數據的人,也加入到投資中,或者很多和大數據關系不大的技術也都紛紛給自己戴上大數據的帽子。”王斌說。
“國外的公司講大數據還只是在營銷策略領域。”王斌介紹說。在中科院發布的《科技發展新態勢與面向2020年的戰略選擇》研究報告中,就提到:大數據技術將關注的重點真正落在數據上,計算機行業要轉變為真正的信息行業。計算機要從追求計算速度為主轉變為提高大數據處理能力為中心。
這種在硬件和軟件上的改變勢必需要大量資金投入,作為投資者和國家戰略應審慎的判斷大數據核心價值以及與自身利害關系,防止產生泡沫。
現今對于大數據的預測或悲觀或樂觀,它究竟會如何改變人類社會,我們還將拭目以待。