用戶的消費習慣、興趣愛好、關系網絡以及整個互聯網的趨勢、潮流都將成為互聯網從業者關注的熱點,而這一切的獲取和分析都離不開大數據。一方面,社會化媒體基礎上的大數據挖掘和分析將會衍生很多應用;另一方面,基于數據分析的營銷咨詢服務也正在興起。
這些專注于數據挖掘和數據服務的公司將成為電子商務乃至互聯網第三方服務業中的新興力量。
數據背后潛藏著巨大的商業機會。以前只有Google、微軟這樣的公司能做大數據的深挖,現在已經有越來越多的創業公司進入,不同公司在不同維度的數據分析和服務正創造出新的商業模式。
《爆發》作者、全球復雜網絡研究專家巴拉巴西教授表示,一項新的學術發現轉化到商業模式會涉及很多的因素和很長的時間,比如社交網絡理論的提出到Facebook等社交網絡興起,經過了數十年的時間。而大數據領域的商業形態發展也會有這樣的滯后性,但資本市場早就開始聚焦于具備數據匯聚以及挖掘分析能力的公司,并開始投資大數據挖掘的早期項目。
大數據的價值
首先,手中握有數據的公司站在金礦上,基于數據交易即可產生很好的效益;其次,基于數據挖掘會有很多商業模式誕生。
“假如我們有了一個數據預報臺,就像為企業裝上了一個GPS和雷達,企業的出海將會更有把握。”馬云(微博)在2012年網商大會上的演講中形象地表示了數據的重要性。
谷歌搜索、Facebook的帖子和微博消息使得人們的行為和情緒的細節化測量成為可能。挖掘用戶的行為習慣和喜好,凌亂紛繁的數據背后找到更符合用戶興趣和習慣的產品和服務,并對產品和服務進行針對性地調整和優化,這就是大數據的價值。大數據也日益顯現出對各個行業的推進力。
騰云天下數據挖掘總監張夏天表示,大數據時代來臨首先由數據豐富度決定的。社交網絡興起,大量的UGC(互聯網術語,全稱為User Generated
Content,即用戶生成內容的意思)內容、音頻、文本信息、視頻、圖片等非結構化數據出現了。另外,物聯網的數據量更大,加上移動互聯網能更準確、更快地收集用戶信息,比如位置、生活信息等數據。從數據量來說,目前已進入大數據時代,但現在的硬件明顯已跟不上數據發展的腳步。
以往大數據通常用來形容一個公司創造的大量非結構化和半結構化數據,而現在提及“大數據”,通常是指解決問題的一種方法,即通過收集、整理生活中方方面面的數據,并對其進行分析挖掘,進而從中獲得有價值信息,最終衍化出一種新的商業模式。
張夏天告訴記者,雖然大數據目前在國內還處于初級階段,但是商業價值已經顯現出來。首先,手中握有數據的公司站在金礦上,基于數據交易即可產生很好的效益;其次,基于數據挖掘會有很多商業模式誕生,定位角度不同,或側重數據分析。比如幫企業做內部數據挖掘,或側重優化,幫企業更精準找到用戶,降低營銷成本,提高企業銷售率,增加利潤。
百分點的聯合創始人蘇萌表示,未來,數據可能成為最大的交易商品。但數據量大并不能算是大數據,大數據的特征是數據量大、數據種類多、非標準化數據的價值最大化。因此,大數據的價值是通過數據共享、交叉復用后獲取最大的數據價值。在他看來,未來大數據將會如基礎設施一樣,有數據提供方、管理者、監管者,數據的交叉復用將大數據變成一大產業。
據統計,目前大數據所形成的市場規模在51億美元左右,而到2017年,此數據預計會上漲到530億美元。
大數據已有商業模式
目前,國內網絡廣告投放正從傳統的面向群體的營銷轉向個性化營銷,從流量購買轉向人群購買。
雖然市場大環境不好,但是具備數據挖掘能力的公司卻倍受資本青睞。
國金證券TMT行業分析師趙國棟表示,大數據是一個很好的視角和工具。從資本角度來看,什么樣的公司有價值,什么樣的公司沒有價值,從其擁有的數據規模、數據的活性和這家公司能運用、解釋數據的能力,就可以看出這家公司的核心競爭力。而這幾個能力正是資本關注的點。
移動互聯網與社交網絡興起將大數據帶入新的征程,互聯網營銷將在行為分析的基礎上向個性化時代過渡。創業公司應用“大數據”告訴廣告商什么是正確的時間,誰是正確的用戶,什么是應該發表的正確內容等,這正好切中了廣告商的需求。
獨到科技創始人張文浩認為,社交網絡產生了海量用戶以及實時和完整的數據,同時社交網絡也記錄了用戶群體的情緒,通過深入挖掘這些數據來了解用戶,然后將這些分析后的數據信息推給需要的品牌商家或是微博營銷公司。
實際上,將用戶群精準細分,直接找到要找的用戶正是社交內容背后數據挖掘所帶來的結果。而通過各種算法實現的數據信息交易,正是張文浩為自己的社交數據挖掘公司設計的盈利模式。目前,這家僅僅五六個人的小公司拿到了天使投資。張文浩表示,目前,國內網絡廣告投放正從傳統的面向群體的營銷轉向個性化營銷,從流量購買轉向人群購買。未來的市場將更多地以人為中心,主動迎合用戶需求,前提就是要找到這部分人群。
在移動互聯網領域,北京騰云天下科技有限公司從開發者角度找到數據挖掘的方向,通過提供免費的技術服務,幫助開發者了解應用狀況。“對于騰云天下來說,服務的同時也聚集了數據,盈利方向是為開發者提供更有價值的信息服務和增值服務。”張夏天表示。
大數據的多重挑戰
如何將數據信息與產品和人相結合,達到產品或服務優化是大數據商業模式延展上的挑戰之一。
伴隨著各種隨身設備、物聯網和云計算云存儲等技術的發展,人和物的所有軌跡都可以被記錄。在移動互聯網的核心網絡節點是人,不再是網頁。數據大爆炸下,怎樣挖掘這些數據,也面臨著技術與商業的雙重挑戰。
在中國軟件開發者大會上,騰訊首席科學家孫國政表示,“現在我們面臨的挑戰一方面是大數據的存儲處理,更重要的是大數據如何為用戶、為廣大網民服務的問題。”
首先,如何將數據信息與產品和人相結合,達到產品或服務優化是大數據商業模式延展上的挑戰之一。張夏天認為,大數據對算法和計算平臺的挑戰加大,計算開銷大增。總量上升,質量下降,這是大數據帶來的重大挑戰。
其次,巧婦難為無米之炊,大數據的關鍵還是在于誰先擁有數據。多盟聯合創始人兼COO張鶴表示,智能手機是根據用戶營銷而不是根據媒體營銷。移動互聯網提供了新的數據來源,數據分析能夠針對每一位用戶的手機信息做精準匹配,但目前大數據時代還沒有真正來臨。多盟雖然每天可覆蓋1800萬用戶,但對用戶行為的描述,還需要更大的數據量。
從市場角度來看,大數據還面臨其他因素的挑戰。架勢無線CEO葉忻直言,大數據很有前景,但是市場中數據噪音太多,會導致數據價值大大降低。以無線營銷為例,大量的刷量以及水軍好評差評等數據已經嚴重干擾了數據的準確性,這實際上大大降低了數據的價值。
電商數據挖掘需要“軍師”
有這樣一個真實案例在微博上流傳很廣。
美國一名男子闖入他家附近的Target店鋪(一家美國零售連鎖超市)進行抗議:“你們竟然給我17歲的女兒發嬰兒尿片和童車的優惠券。”店鋪經理立刻向來者致歉,其實經理并不知道這是公司運行大數據系統的結果。一個月后,這位父親來道歉,他的女兒的確懷孕了。
這個故事就是基于數據分析的精準營銷的結果。百分點現在做的就是通過分析用戶在網絡上的消費行為數據,幫助電商企業實現“千人千面”精準營銷。
大數據時代,營銷將會更多地依賴數據,從而更精準地找到用戶。百分百創始人蘇萌表示,根據來自不同平臺的數據進一步挖掘和分析,找到這些數據相對應的人群,再將這些群體進行個性化的對比,并以此展開個性化的營銷服務。例如發送EDM,或者流量對接,或者跟傳統搜索結合。
“大數據的一個重要趨勢就是數據服務變革,針對群體,把人分成很多群體,每個都給予不同的服務。”百分點首席科學家周濤表示,以電子商務為例,傳統電商推薦,多是使用協同算法,挖掘不同產品間的關聯度。但在百分點,這樣的算法已經從基礎服務形式,下沉到推薦引擎框架底層,不直接推薦結果。
蘇萌告訴記者,在數據爆炸的年代,人們經常淹沒在海量商品和資訊之中,不知道自己想要什么。而百分點的數據挖掘正是主要側重于如何找到用戶需求,以及如何將數據轉化為對客戶的幫助。
通俗來講,電商網站通常用的關聯規則并不是個性化算法,比如白酒、花生米兩個可能對所有用戶都關聯度很高,就會推薦這兩個商品。但是個性推薦,則會通過場景和需求來調動不同算法,計算對于個體真實的用戶需求。
個性化推薦知道用戶喜歡什么,確實地提供商品推薦信息,于是就發揮了“導購”的作用,這無疑更能刺激購買。對于電商企業來說,在精細化運營的趨勢下,無疑會為更精準的營銷和用戶重復購買。
以走秀網為例,采用了百分點提供的分析數據后,消費者可以通過走秀網上的“本月熱銷”(個性化熱銷榜)、“猜您喜歡的”(個性化熱覽榜)瀏覽或購買自己感興趣的商品。其個性化服務能力大大提高。
蘇萌表示,百分點每天獲取的數據主要分為兩類,一類是內容和商品基礎數據容量,每天大約在TB級的規模;另一類是一些關于合作伙伴網絡上的行為偏好數據,例如瀏覽過什么、收藏過什么、購買過什么等數據,這部分數據大約達到了GB級的規模。“這兩類基本是離消費者最近的數據,可以說是電子商務最核心的數據。”
和線下零售不同的是,電子商務網站都有非常豐富的顧客歷史數據,包括登錄、點擊、瀏覽以及購買等等。如果你把數據放在地下室讓它們堆滿灰塵,這些數據就是一項負資產,它們需要硬件來存儲,需要人員來管理,卻沒有任何使用價值。
蘇萌表示,在百分點有兩大數據處理平臺,一個是流處理平臺,另一個是批處理平臺。前者會處理一些實時性比較高的數據,例如消費者購買意圖或者點擊預估數據。而在批處理平臺上面,更多的是做一些基礎任務,例如全網行為的挖掘分析、BI分析、商務報表等,會按照時間調度來完成。這兩個數據平臺,正是個性化推薦和分析運營工具的支撐。
數據服務前景可期
產業界對于大數據的熱情持續升溫的同時,資本也敏銳地發現了這一趨勢,并開始關注數據挖掘和服務類公司。基于此,《中國經營報》記者專訪了對這個領域深有研究的IDG資本合伙人李豐。
《中國經營報》:現在大數據越來越多被提及,你覺得數據挖掘在商業模式上有什么新的趨勢?
李豐:大數據就是實時數據的處理和實時結果的導向,越來越多的數據挖掘前端化,或者說直接為消費者感知和直接提供消費者所需要的服務,通常形式是誕生了各種各樣的個性化推薦的服務。
《中國經營報》:在大數據背景下,對于各種從事數據挖掘的公司有什么新的機會?
李豐:大數據的前提是數據總量的迅速增加以及數據的流動性增加,前者是由于用戶的行為在手機和電腦上越來越多,門檻越來越低;另外一個因素是因為各種平臺的開放導致流動性增加,以上兩個因素的誕生才能催生更多的直接為消費者服務的大數據公司。以北京百分點信息科技有限公司(以下簡稱“百分點”)為例,這家公司的方向、應用和誕生時間,恰好符合了這樣的趨勢。
《中國經營報》:從投資角度,你怎么看數據挖掘類公司的投資價值和公司前景?
李豐:我看好以大數據為出發點的商業模式和電商的后續服務產品。它們的前景大方向是符合趨勢的,但是具體產品和數據處理能力,可能是最終成敗的因素。
《中國經營報》:從行業角度看做大數據的門檻在哪里?做數據挖掘需要具備哪些重要的因素?
李豐:門檻主要是如何獲得大量數據,數據的質量、相關性以及是否有好的處理能力和技術,最終應用的方向是商業化的關鍵。
《中國經營報》:在你看來,IDG投資百分點主要看中哪幾個關鍵點?你認為百分點所處的競爭環境如何?
李豐:百分點具有良好的團隊、技術能力、行業能力以及研究能力,在它們的創始人之間既有互補又有突出。另外,它們的誕生和發展符合了大的趨勢,而且相對又有一點領先。目前的競爭環境主要取決于國內互聯網公司,尤其是大公司對于開放數據的態度和速度,同時也包括它們的技術能力和產品是否能夠不斷地超越用戶的需求。