來(lái)源:《經(jīng)濟(jì)日?qǐng)?bào)》
顧客走進(jìn)商店,在一貨架前只停留片刻,商家就可以通過(guò)大數(shù)據(jù)技術(shù),立刻知道該顧客的購(gòu)買(mǎi)習(xí)慣,以及是否購(gòu)買(mǎi)過(guò)這個(gè)牌子的產(chǎn)品。商家再通過(guò)實(shí)時(shí)分析,確定個(gè)性化營(yíng)銷(xiāo)策略,及時(shí)將優(yōu)惠信息發(fā)送到顧客手機(jī)上,以激發(fā)顧客的購(gòu)買(mǎi)欲望,而商家推廣新產(chǎn)品的效率也得到了提高。
近日,在北京舉辦的2012年Hadoop與大數(shù)據(jù)技術(shù)大會(huì)上,中科院計(jì)算所所長(zhǎng)孫凝暉認(rèn)為,在未來(lái)大數(shù)據(jù)會(huì)成為一個(gè)新的行業(yè),隨著更多有價(jià)值的數(shù)據(jù)從海量數(shù)據(jù)中被發(fā)掘出來(lái),將會(huì)產(chǎn)生許多新的商業(yè)形態(tài)、新的企業(yè)和新的服務(wù)。
大數(shù)據(jù)是信息產(chǎn)業(yè)領(lǐng)域內(nèi)最具發(fā)展?jié)摿Φ男袠I(yè),全球IT研究與顧問(wèn)咨詢(xún)公司Gartner數(shù)據(jù)中心首席分析師張瑾介紹說(shuō),最新研究數(shù)據(jù)顯示,全球數(shù)據(jù)量每年至少增長(zhǎng)59%。大數(shù)據(jù)將帶來(lái)大量就業(yè)機(jī)會(huì)。到2015年,大數(shù)據(jù)將為全球帶來(lái)440萬(wàn)個(gè)IT崗位,為中國(guó)帶來(lái)1萬(wàn)個(gè)技術(shù)職位。
大數(shù)據(jù)量大且雜。數(shù)據(jù)源分為兩類(lèi):一類(lèi)是用戶(hù)通過(guò)社交媒體、搜索等用戶(hù)活動(dòng)產(chǎn)生的數(shù)據(jù);另一類(lèi)是機(jī)器產(chǎn)生的數(shù)據(jù)。IBM中國(guó)研究院信息管理與醫(yī)療健康首席科學(xué)家潘越認(rèn)為,大數(shù)據(jù)不僅指數(shù)據(jù)量大,與傳統(tǒng)數(shù)據(jù)的不同點(diǎn)還在于數(shù)據(jù)實(shí)時(shí)處理速度要求高,數(shù)據(jù)形態(tài)呈現(xiàn)多樣性,以及大數(shù)據(jù)的不確定性。傳統(tǒng)數(shù)據(jù)分析周期是以月、周、天來(lái)劃分,而大數(shù)據(jù)時(shí)代的很多分析必須是實(shí)時(shí)作出決策,否則大數(shù)據(jù)價(jià)值便無(wú)法體現(xiàn)。
在大數(shù)據(jù)中,有70%至85%的數(shù)據(jù)是“多種數(shù)據(jù)混合體”,數(shù)據(jù)處理的復(fù)雜度高,傳統(tǒng)數(shù)據(jù)有87%的性能問(wèn)題與數(shù)據(jù)增長(zhǎng)有關(guān)。數(shù)據(jù)管理的花費(fèi)也大,是采購(gòu)存儲(chǔ)花費(fèi)的3倍。張瑾介紹說(shuō),目前大數(shù)據(jù)在普通設(shè)備上無(wú)法運(yùn)行和備份。大數(shù)據(jù)應(yīng)該實(shí)現(xiàn)低成本運(yùn)算和高可用,也就是通過(guò)使用消費(fèi)級(jí)硬件,以及軟件設(shè)計(jì)、架構(gòu)設(shè)計(jì),來(lái)實(shí)現(xiàn)大數(shù)據(jù)管理,而不是靠以往采用的高性能、高端設(shè)備來(lái)實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)。
在大數(shù)據(jù)處理工具Hadoop上,目前集成了很多行業(yè)應(yīng)用。一些企業(yè)在大會(huì)上展示了他們?cè)谖锪鳌⑨t(yī)療、零售業(yè),以及公共服務(wù)等領(lǐng)域的應(yīng)用成果。但有專(zhuān)家建議,在實(shí)施“大數(shù)據(jù)”前,要明確需求和目標(biāo),以免因技術(shù)和商業(yè)的不成熟性,給企業(yè)和用戶(hù)帶來(lái)風(fēng)險(xiǎn)。