來源:中國科技網(wǎng)-科技日報
[導(dǎo)讀] 美國研究人員正嘗試著給計算機植入人工智能的數(shù)字化“種子”——讓計算機系統(tǒng)不斷觀看各種圖畫,并自己決定它看到的內(nèi)容都是什么意思。
原標(biāo)題 讓計算機擁有“常識” ——科學(xué)家嘗試為計算機植入人工智能的“種子”。
研究人員讓“尼爾”學(xué)習(xí)建立常識,該計算機程序在兩個計算機組群上運行。
本報記者 常麗君 綜合外電
今日視點
讓機器以一種“常識”的方式自行思考是計算領(lǐng)域的“圣杯”。美國卡內(nèi)基•梅隆大學(xué)研究人員正嘗試著給計算機植入人工智能的數(shù)字化“種子”——讓計算機系統(tǒng)不斷觀看各種圖畫,并自己決定它看到的內(nèi)容都是什么意思。研究小組將在12月4日澳大利亞悉尼召開的美國電氣與電子工程師協(xié)會(IEEE)國際機器人視覺大會報告他們的成果。
從今年7月開始,在卡內(nèi)基•梅隆大學(xué),一個名為“尼爾”(NEIL)的計算機程序就在24小時不停地從互聯(lián)網(wǎng)上搜尋圖像。其中有幾個關(guān)鍵小步驟,就是它要自己決定這些圖像之間的相互關(guān)系,盡可能自行理解它們,以此建立起我們所謂的“常識”。
常識與聯(lián)想
“尼爾”是“無休止圖像學(xué)習(xí)”(Never Ending Image Learning)的縮寫,其在兩個計算機組群上運行,包括200個處理器核。隨著它的視圖數(shù)據(jù)越來越多,積累的“常識”也越來越多。常識是人們似乎知道卻不曾明說的信息,比如汽車通常是跑在公路上,建筑物往往是垂直的,鴨子看起來很像鵝等。
“任何智能都要有常識來幫它作決策。”卡內(nèi)基•梅隆機器人研究所教授阿比納伍•古普塔說,讓一臺計算機自己聯(lián)想,對它來說是完全不同的挑戰(zhàn)。比起編制一臺超級計算機程序來說,圓滿迅速地完成一項任務(wù)更難以應(yīng)付。比如1985年卡內(nèi)基•梅隆研究人員編制下棋程序讓一臺計算機下棋;12年后,計算機打敗了國際象棋冠軍加里•卡斯帕羅夫。
麻省理工大學(xué)人工智能專家凱瑟琳•哈瓦希說,人類能不斷利用“不言而喻的假定這一巨大庫存”來作決策,而計算機卻不能。對一些人類能迅速作出反應(yīng)的問題,計算機卻要花更長時間才能算出來。“長頸鹿能坐上你的汽車嗎?我們甚至不用思考就能得出答案。”她說,因為我們對長頸鹿的身體大小有一種常識。
隨著程序運行,“尼爾”逐漸能給圖像做次級分類,比如三輪車可以分為小孩用、大人用,還能裝上發(fā)動機變成三輪摩托;汽車有不同的商標(biāo)和樣式等。然后它慢慢注意到事物之間的聯(lián)系:斑馬往往出現(xiàn)在大草原上,老虎看起來有點像斑馬,股票交易所大樓通常擠滿了人。
在短短4個月里,“尼爾”的200個處理器核已經(jīng)分析了3百萬幅圖像,從其中50萬幅中識別出了1500種物體,1200個場景,并把相關(guān)的點連接起來做了2500個關(guān)系聯(lián)想。“尼爾”生成的聯(lián)想有些是錯的,比如“犀牛是一種羚羊”,而有些很奇怪,如“演員在監(jiān)獄牢房里”或“新聞主播看起來像巴拉克•奧巴馬”。
“我爬,我看,我學(xué)習(xí)”
“圖像是學(xué)習(xí)視覺性質(zhì)的最佳方法,”阿比納伍•古普塔說,“圖像也包括了與這個世界有關(guān)的許多常識信息。人類自己學(xué)習(xí)了這一點,對于‘尼爾’,我們希望它也能像我們一樣。”
伊利諾伊大學(xué)芝加哥分校計算機科學(xué)系主任、人工智能專家羅伯特•斯洛恩說,“尼爾”的方法會產(chǎn)生有趣的結(jié)果,因為只用語言去教一臺計算機“會帶來各種問題”,“如果它們對著不管什么地方看到的動物,都不停地說‘斑馬、斑馬、斑馬’,我會對這一幕印象深刻。”
機器人學(xué)博士生阿比納伍•希瑞瓦斯塔伍說,“尼爾”有時也會出錯,所以還需要有人工參與。比如谷歌圖像搜索可能會“誤導(dǎo)”它,讓它以為“pink”(意為粉紅色)是一位歌星的名字,而不是一種顏色。
“人們不一定總是知道該怎么去教計算機,以及教它們學(xué)什么,但發(fā)現(xiàn)它什么時候出錯,人們是很擅長的。”希瑞瓦斯塔伍說,人們會告訴“尼爾”,物體、場景等屬于哪一類,以便研究分析。
有時候,“尼爾”的預(yù)測能力也讓研究人員震驚。在搜尋“蘋果”時,不僅給出了水果圖,還有蘋果電腦;搜索F-18時不僅發(fā)現(xiàn)了戰(zhàn)斗機,還有F-18級雙體船,這是古普塔和他的陸地小組所不知道的。
“根據(jù)我們50年從事計算機視覺研究的經(jīng)驗,你掌握的數(shù)據(jù)越多,計算機視覺就會變得越好,”古普塔說。“尼爾”的座右銘是“我爬、我看、我學(xué)習(xí)”,研究人員希望讓“尼爾”一直運行下去,這也意味著它可能會一點點地變得越來越聰明;但也可能不會。
未來角色
“尼爾”擔(dān)負(fù)著當(dāng)前計算機視覺的進步。計算機視覺能讓計算機程序識別和標(biāo)記出圖像中的物體,找出場景特征,認(rèn)出圖像屬性,如顏色、明暗、材質(zhì)等,所有這一切都力求使人類對它的監(jiān)管達到最小。反過來,它生成的數(shù)據(jù)也會進一步加強計算機理解視覺世界的能力。
古普塔對項目的初步進展感到高興,“當(dāng)我們開始這個項目時,不敢確保它是否可行。這還只是個開始。”今后,“尼爾”還要分析YouTube上的大量視頻,以尋找事物之間的聯(lián)系。
“尼爾”項目的一個目標(biāo)是,創(chuàng)造世界最大的視圖體系知識庫,在這個庫中,所有的物體、場景、動作、特征以及背景關(guān)系都被加上標(biāo)記并分門別類。目前,ImageNet和Visipedia項目也在人工匯編這些結(jié)構(gòu)數(shù)據(jù),但互聯(lián)網(wǎng)規(guī)模如此巨大,單一個Facebook(臉譜)就有超過2000億幅圖像,要分析它們,唯一的希望是教會計算機來做。
此外,這一項目由谷歌公司和國防部海軍研究辦公室共同資助。谷歌公司和海軍研究辦公室都沒有回答他們?yōu)楹我Y助“尼爾”,但也有一些線索。“海軍研究”網(wǎng)站上指出,“當(dāng)前的作戰(zhàn)空間環(huán)境比過去要復(fù)雜得多,數(shù)據(jù)到達決策系統(tǒng)的速度正在提高,而能把這些數(shù)據(jù)轉(zhuǎn)化為決策方案的人員數(shù)量卻正在下降。”也就是說,電腦可能在未來戰(zhàn)爭中作出許多決策,“在許多軍事行動中,根本不需要人類到場。”
本篇文章來源于: 中國科技網(wǎng) www.wokeji.com