來源:《經濟日報》
顧客走進商店,在一貨架前只停留片刻,商家就可以通過大數據技術,立刻知道該顧客的購買習慣,以及是否購買過這個牌子的產品。商家再通過實時分析,確定個性化營銷策略,及時將優惠信息發送到顧客手機上,以激發顧客的購買欲望,而商家推廣新產品的效率也得到了提高。
近日,在北京舉辦的2012年Hadoop與大數據技術大會上,中科院計算所所長孫凝暉認為,在未來大數據會成為一個新的行業,隨著更多有價值的數據從海量數據中被發掘出來,將會產生許多新的商業形態、新的企業和新的服務。
大數據是信息產業領域內最具發展潛力的行業,全球IT研究與顧問咨詢公司Gartner數據中心首席分析師張瑾介紹說,最新研究數據顯示,全球數據量每年至少增長59%。大數據將帶來大量就業機會。到2015年,大數據將為全球帶來440萬個IT崗位,為中國帶來1萬個技術職位。
大數據量大且雜。數據源分為兩類:一類是用戶通過社交媒體、搜索等用戶活動產生的數據;另一類是機器產生的數據。IBM中國研究院信息管理與醫療健康首席科學家潘越認為,大數據不僅指數據量大,與傳統數據的不同點還在于數據實時處理速度要求高,數據形態呈現多樣性,以及大數據的不確定性。傳統數據分析周期是以月、周、天來劃分,而大數據時代的很多分析必須是實時作出決策,否則大數據價值便無法體現。
在大數據中,有70%至85%的數據是“多種數據混合體”,數據處理的復雜度高,傳統數據有87%的性能問題與數據增長有關。數據管理的花費也大,是采購存儲花費的3倍。張瑾介紹說,目前大數據在普通設備上無法運行和備份。大數據應該實現低成本運算和高可用,也就是通過使用消費級硬件,以及軟件設計、架構設計,來實現大數據管理,而不是靠以往采用的高性能、高端設備來實現數據存儲。
在大數據處理工具Hadoop上,目前集成了很多行業應用。一些企業在大會上展示了他們在物流、醫療、零售業,以及公共服務等領域的應用成果。但有專家建議,在實施“大數據”前,要明確需求和目標,以免因技術和商業的不成熟性,給企業和用戶帶來風險。