“大數據”這個詞熱了十年,“人工智能”這個詞熱了也超過了一年。回顧近兩年的發展,我們會發現在很多領域機器其實都超過了人類。這代表什么樣的商機呢?是人類歷史以來最大的商機。
我們已經看到移動互聯網是個巨大的市場,但它連人工智能的十分之一都沒有。十年后,如果我們回顧人類的發展,會發現沒有任何市場比人工智能來得更大。
我從30年前就開始探索人工智能,但是沒有天時地利人和——機器不夠快,大數據中心不存在,數據不夠多,算法不夠先進……30年來,不斷有科學家發明新的技術,雖然人工智能還有很多局限,沒有情感,一次只能涉足一個領域,不能跨領域思維,但是從最近四五年開始,這些技術在很多狹窄領域里已經遠遠超過了人類。
如何用一個更通俗的方法解釋什么是人工智能?想象一臺機器是剛出生的小寶寶,人類的小寶寶是用教育、用知識、用書本讓他們慢慢成長,但人工智能用什么來幫助他們成長呢?就是大數據。
但是機器一次只能專注在某一個領域,在單一領域它可以做得非常好,但是跨領域做不到,所以人類還是有機會的。美國科學家發明的深度學習在中國已經普遍開始使用,就是這個道理。
由于我們可以統籌各種知識和經驗,姑且認為人的大腦還是比機器優秀。但是機器有一個特別大的優勢,即“過目不忘”,不僅可以儲存大量數據,而且能夠從數據中學會推理。
我們投資的一家做人臉識別的公司,訓練的是50億張人臉,比我們多看了1000倍,我們要用一輩子時間,它可能是只用三天時間就記住了。所以現在保安這一類用人臉來做的工作根本比不上人工智能。
再以無人駕駛為例,一個人,即便一天開100公里,一年365天地開,三五十年累積起來可能也就幾百萬公里的經驗。但是今天特斯拉已經有20億公里數據,比我們多了1000倍,而且算法還在不斷演進,它已經超過了人類。
海量的大數據在很多狹窄的領域遠遠擊敗人類所能夠做的極限,可以說,人類永遠不會有任何機會勝過機器。比如我們讀一本書的速度是很慢的,而IBM人工智能參加電視比賽的時候,一天就能夠把全部美國國會圖書館的所有藏書讀完。
大數據正在各個領域幫助人類創造價值。今天人們都在做大數據的人工智能,如百度的一條搜索,今日頭條的排序,淘寶推薦的每個產品,滴滴每次對接司機……這背后都是人工智能。
結合大數據的人工智能,可以廣泛應用于傳統領域,比如銀行、保險、券商、機器人炒股。我個人的投資已經兩年沒有給人,都是機器人幫我理財,但回報一定比人要好,這些領域人類根本不是對手。
在醫療、教育等其他傳統領域也存在著大量數據,機器算法、人工智能可能幾天之后就能比人做得更好,產生的商業價值是不可想象的,超過互聯網和人類所有的歷史累積。
創新工場不只是在做預測。我們所管理的基金投資孵化的項目,超過一半是針對這個領域的,我們是真金白銀在賭即將來臨的人工智能時代。
這個時代即將來臨,我們能做什么事情呢?
首先是建立好一體化大數據中心。這個事情最重要,為什么呢?所有應用需要的數據不是一個公司能夠收集的,這個數據中心必須一體化,因為除了應用里面的數據之外,用戶填的數據,外面還要抓取各種數據。
我們還希望收集在一體化數據中心里的數據能得到很好的保護,從而能夠探索將這些數據變成服務,幫助創業公司創造價值。
比如說要做一個貸款的APP,不能只是依靠用戶填寫的幾樣數據就決定貸不貸,背后還要有整個征信數據,包括出行數據、消費數據等等。它可能提交一個要求,讓大數據人工智能判斷這個人還款概率是多少,欺詐概率是多少,有否犯罪記錄,這些都可以算清楚,而且并不需要暴露用戶隱私數據。
二是計算資源。這對創業公司來說特別重要。APP時代,我們常說中國創業成本達到歷史新低,很不幸,人工智能加大數據,創業成本將會達到歷史新高。我們投資的一家公司,七個小朋友,沒有人超過三十歲,他們成立的第一天,就把我們打的款花完了,還只是買了一些機器,因為做的是無人駕駛。
但我們不可能讓成千上萬的雙創項目都買機器。要把這些機器放在數據中心里,將CPU和GPU的功能很好結合,談個更好的采購價錢,不同的時段按照使用收費,這個也是未來大數據能夠提供的潛在機會。
第三是數據量需要非常多。數據收集是一個逐漸的過程。有些數據可能不能公開,有些公司數據可能需要保護隱私,但是可以用API做一個接口,不泄露數據。這些數據怎樣整合起來?首先要有一個一體化數據中心。
谷歌成立了一家公司,旗下有100萬臺數據庫服務器,是世界上最大的一體化數據中心,它把所有數據加以利用,用在搜索就是谷歌,用在診斷就是谷歌健康,用在汽車就是無人駕駛……背后都是人工智能加上一體化大數據。
四是要培訓大量人才。人工智能聽起來非常高深,但是培養一個人工智能工程師,需要多久呢?這么高深的技術也許至少要十年、二十年?做網絡安全的都是要有十五、二十年的工齡,做計算機網絡和其他的領域都要讀博士再做十年工作吧?實際上,一個優秀的理工學生半年就可以成為AI工程師,應該做一個更大的平臺培訓年輕人。
創新工場看到了這些機會,正在策劃成立一個產業聯盟,我們非常希望把這個聯盟建立起來。在計算方面,數據中心方面,和北京供銷大數據集團合作,在購買大數據方面政府能提供多少,業界能買多少,能夠授權多少,我們希望也能統籌大數據這件事。
這幾件事情里特別核心的一件就是大數據中心和人工智能算法的整合。讓我們一起來引領人工智能和大數據時代的來臨。
來源:汽車生態圈微信號