今日視點
作為新一代信息技術的核心之一,大數據技術已得到業內人士高度關注,許多IT公司和投資者均加強了對該技術研發和應用的投入。成立于2008年、總部位于西雅圖的芭蕉技術公司無疑是該領域的佼佼者。不久前,芭蕉技術公司在舊金山舉辦的大數據技術研討和培訓會議上,展示了其先進的大數據技術開發理念及業務特點。針對當前大數據技術發展情況和應用前景,以及中美大數據技術合作等問題,科技日報記者在感恩節期間對該公司董事長切斯特.達文波特先生進行了專訪。
大數據拓展了網絡服務空間和前景
在美國政界和商界獲得成功的達文波特,多年前已敏銳地洞察到數據庫及大數據技術對未來網絡發展的重要性。年輕時就對相對論入迷的他一直被愛因斯坦有關時空變化的論述所吸引。他告訴記者,人類開發利用網絡空間需要新技術的支持,而如何對海量數據進行采集、管理和儲存則是最為重要的技術領域之一。“芭蕉公司創立之初主要致力于軟件技術開發和服務,2012年后則傾全力開展大數據技術研發和服務。”
達文波特介紹說,目前網絡數據每兩年翻一番,每天需要對100億組數據進行處理,每秒產生4G以上新數據。2017年將有50%的企業使用混合云,到2020年將有280億臺物聯網設備處于運營之中。因此,數據庫和大數據技術對未來網絡自身發展及其所提供的服務至關重要,預計2017年大數據市場將達到500億美元的規模。
“經過短短幾年的發展,獨具特色的芭蕉大數據技術和服務已經引起業內高度重視。目前蘋果、微軟、IBM、CISCO和亞馬遜等IT巨頭均在使用芭蕉大數據技術或是其重要客戶。”他舉例說,芭蕉與CISCO的合作是幫其搭建一個Riak/Mesos框架,以此來創建一個能夠在InterCloud平臺上運行的基于Riak的數據微服務和分布式文檔系統。
用戶需要的是安全、實用和操作簡便
達文波特介紹說,現有的數據約80%為非結構化數據,芭蕉公司提供的大數據技術突破了只為特定公眾而研發特定數據庫的局限。芭蕉大數據的技術核心是Riak系統,與芒果(MongoDB)等其他非關系型數據庫(NoSQL)技術相比,Riak是一個開源數據庫,以分布式、水平擴展和高容錯性等特點著稱。隨著大數據技術的發展,芭蕉大數據產品服務形成了一條較為成熟的產品技術鏈,即從Riak核心發展到Riak鍵值再到多模型解決方案,之后產生芭蕉大數據平臺和應用棧。
他告訴記者,建立在Riak核心之上的Riak鍵值數據庫技術,具有可用性高、多集群復制能力、易于增加節點向外擴展增容、保證數據精準度的優勢,已經得到用戶高度認可。目前芭蕉大數據技術平臺不僅能提供具有綜合性的核心服務,包括減少人工操作的復雜性,對單獨的群和NoSQL數據庫進行管理,提高高速緩存和存儲邏輯分析能力,而且可以提供分布式、可擴展性和容錯性構架,為集成數據庫提供資源管理程序及其它關鍵大數據應用組件等。
達文波特認為,芭蕉數據平臺具有六大技術特點,即簡化復雜的程序、高可用性、容錯性、將實時數據分析和Apache Spark相結合、整合Redis提供更高速應用性能、整合Solr提供更豐富的查詢結果。由此可以看出,與其他大數據公司的數據技術相比,芭蕉的技術優勢有四點:一是具有數據準確、可擴展性和實用性;二是通過整合進行增值;三是通過創建核心知識產權支持整合;四是合作伙伴可自主吸收采用。達文波特希望芭蕉數據軟件能夠為未來國際大數據技術行業制定標準提供幫助,開發出世界上最先進的軟件來管理NoSQL數據庫。
對與中國開展大數據合作充滿信心
達文波特稱,近年來中國網絡應用和服務發展速度很快,特別是物聯網行業發展異常迅猛,預計2014年到2019年,中國物聯網市場年均復合增長率將達到32.15%,為大數據技術開發和應用帶來了巨大的潛在市場。他指出,中國政府一直非常重視和支持大數據技術研發與應用,目前許多中國的IT公司已開始進行大數據技術開發,且廣泛尋求國際合作,芭蕉公司也正在尋求中國的戰略合作伙伴,迫切希望抓住機會,與中國開展深入、廣泛的技術合作。
針對合作中的數據安全性問題,他明確指出,芭蕉技術的一大特點是把數據保存在用戶指定的數據庫中,而且不需要用戶開放數據資源。“我們的軟件通常是不留‘后門’的,但也可以根據用戶的特殊需要留有‘后門’。”達文波特說,芭蕉公司不僅保持和追求非常低廉的產品價格,更是一直把確保用戶數據安全作為宗旨。
在結束采訪時,達文波特感慨地說,創新是發展的不竭動力,新技術和新產品提升了人類的生活品質。“盡管我本人不開發新技術,但我一直都對新技術的開發和使用抱有濃厚的興趣。”
摘自 中國科技網