《中國高新技術產業導報》
大數據作為一個網絡熱詞,近來被頻頻提及。事實上,全球行業巨頭已經意識到“大數據時代”的到來,紛紛通過收購大數據相關廠商進行技術整合。專家表示,在“大數據時代”,中國有機會引領云計算產業的發展。
本報實習記者 亞文輝報道
在近日舉行的2012第五屆中國數據中心大會上,中國電子信息產業發展研究院副總工程師烏寶貴表示,數據中心作為企業IT建設的主要支撐平臺,如何在有效合理地控制總體擁有成本的前提下,從大數據中獲取有價值的信息;如何高效利用云計算資源,更好地為企業業務的發展服務,以及如何簡化數據的管理,是企業當前必須面對的挑戰。
大數據作為一個網絡熱詞,近來被頻頻提及。事實上,全球行業巨頭已經意識到“大數據時代”的到來,紛紛通過收購大數據相關廠商進行技術整合。中國科學院院士、北京航空航天大學校長懷進鵬認為,在“大數據時代”,中國有機會引領云計算產業的發展。
“大數據時代”來臨
世紀互聯技術戰略與政府事務部首席專家李志霄在談到大數據時表示,“用數據爆炸來形容今天的IT發展一點也不為過,數據增長永無止境”。然而,對于什么是大數據,目前業界并沒有統一的定義。
在近日舉行的Oracle大數據與極致分析媒體交流會上,甲骨文公司副總裁兼大中華區技術總經理喻思成提出了一個看法。他認為,大數據具有四大特性,即巨大的數據量,集中儲存/集中計算已經無法處理巨大的數據量;多結構化數據,包括文本、圖片、視頻和文檔等;增長速度很快,用戶基數龐大、設備數量眾多、實時海量、數據指數級別增長;價值密度低,單條數據并無太多價值,但龐大的數據量蘊含著巨大的財富。
有專家表示,大數據的推動因素主要來自一些特大型公司,如谷歌、Youtube等,這些公司需要以非常優化的方式分析數據和讓計算與存儲配合工作。另外還有一些來自健康醫療、地理空間影像和數字媒體等行業的各種大數據,這些數據不一定有多大,但是處理這些數據集通常要分配到幾個系統、耗費超過24個小時的時間才能完成。
事實上,目前,EMC、惠普、IBM、微軟等巨頭已經意識到“大數據時代”的到來,紛紛通過收購大數據相關廠商進行技術整合。
業內專家分析認為,“大數據時代”產業發展有三大趨勢。一是應用軟件將會泛互聯網化;二是行業將會垂直整合,越靠近終端用戶的企業在產業鏈上擁有更大的發言權;三是數據將成為資產。這三大趨勢都是圍繞數據展開的,泛互聯網化是收集數據的重要渠道,沒有泛互聯網化的應用軟件,企業就難以獲得用戶的行為數據;行業垂直整合數據運用層面,通過搜集大量的用戶數據,更貼近用戶,更理解用戶,為其提供更適用的服務;數據成為資產更強調數據的戰略意義。
挑戰和機遇并存
在“大數據時代”,挑戰和機遇并存。曾任雅虎中國總經理的謝文對記者表示,挑戰主要集中在3個方面:IT廠商的戰略決策能力、技術開發和數據處理能力以及組織和運營能力。
有專家表示,大數據并不意味著要顛覆或者替代原有的投資,通過平臺集成的策略,實現對原有數據平臺的擴展是大數據解決方案的一個重要發展方向。在數據存儲和性能優化方面,IT廠商能為企業提供多樣化的技術路徑,企業必須理解的是哪些技術能夠切實有效地幫助自己降低成本、提高運行效率。
臺灣云端運算聯盟技術專家委員會大數據專家委員陳育杰表示,企業在過去十幾年間所看到的數據本身是殘缺的。在“大數據時代”,企業看數據的整個角度和思維脈絡都要發生根本的變化,如何更好地實現數據的可視化是一個挑戰。大數據帶來的第二個挑戰是,傳統的數據庫和數據倉庫在應對大數據這個議題時會面臨性價比的問題。大量非結構化數據帶來的是數據量爆發式的增長,對存儲容量、傳輸速率、計算速度等要求更高,因此企業必須考慮更具性價比的計算和存儲方式。
機遇和挑戰是一個鏡子的兩面。謝文表示,“大數據時代”的來臨也會為IT廠商帶來潛在的機會。數據量的增加為IT廠商提供了精確把握用戶群體和個體網絡行為模式的基礎,如果能夠充分利用,就可以探索個人化、個性化、精確化和智能化地進行廣告推送和服務推廣服務,創立比現有廣告和產品推廣形式性價比高數倍甚至數十倍的全新商業模式。同時,IT廠商也可以通過對大數據的把握,尋找更多更好地增加用戶黏性、開發新產品和新服務、降低運營成本的方法和途徑。
ESG中國區總經理兼高級分析師王叢認為,大數據這一領域將會有一些新技術推出,在未來1-2年內,預計會不斷涌現能處理大型非結構化數據的技術,而這些新技術反過來也將推動IT廠商的發展。
云計算浪里淘沙
根據國際數據公司(IDC)2011年發布的報告,全球信息總量每過兩年就會增長1倍。僅2011年,全球被創建和被復制的數據總量為1.8ZB,相較2010年同期上漲超過1ZB,預計到2020年這一數值將增長到35ZB。
好耶集團董事長兼首席執行官陳恂表示,要從海量數據中獲取洞察,常規技術已經難以應對P(1P=1024T)級的大規模數據運算,云計算技術是惟一的選擇。
那么,云計算與大數據有什么樣的關系?謝文認為,云計算是大數據時代的重要組成部分。而有的評論則認為,本質上,云計算與大數據的關系是靜與動的關系。云計算強調的是計算,是動的概念,而數據則是計算的對象,是靜的概念。如果數據是財富,那么大數據就是寶藏,云計算就是挖掘和利用寶藏的利器。沒有強大的計算能力,數據寶藏終究是鏡中花;沒有大數據的積淀,云計算也只能是殺雞用的宰牛刀。
有分析認為,大規模數據的管理存在很高的復雜性,正因為如此,大數據分析通常在本地服務器集群中進行,而云計算的優勢在于盡可能有效地優化現有資源,如果部署得當,大數據和云計算的結合絕對是強強聯手。
“中國的互聯網企業已經站在世界云計算的浪尖上。”懷進鵬進一步表示,在大數據的浪潮下,中國有機會引領云計算產業的發展。