12月13日,計(jì)算機(jī)視覺方向的三大頂級(jí)會(huì)議之一ICCV(國(guó)際計(jì)算機(jī)視覺大會(huì))就要在智利圣地亞哥拉開帷幕了。
對(duì)業(yè)內(nèi)人士來說,這是盛會(huì)。當(dāng)然,非專業(yè)人士大概會(huì)問:這和我有什么關(guān)系?
其實(shí),逐漸從學(xué)術(shù)界走向工業(yè)界的計(jì)算機(jī)視覺,已經(jīng)在人們生活中存在很長(zhǎng)時(shí)間了。
日前,科技日?qǐng)?bào)采訪了計(jì)算機(jī)視覺底層技術(shù)領(lǐng)域?qū)<掖饔顦s教授。他此前在韓國(guó)科學(xué)技術(shù)院獲得終身教職,曾多次擔(dān)任ICCV領(lǐng)域主席。如今,戴宇榮離開學(xué)術(shù)界,加入專注計(jì)算機(jī)視覺的創(chuàng)業(yè)公司“商湯科技”。
難點(diǎn):在一堆數(shù)字里找出一個(gè)人
戴宇榮教授一直在做的,就是教計(jì)算機(jī)學(xué)會(huì)怎么看。“計(jì)算機(jī)看到的,永遠(yuǎn)只有0和1的數(shù)字。即使是圖像,在它們看來,照樣是0和1。”他向記者解釋,要理解研究者在計(jì)算機(jī)視覺上遇到的麻煩,就要先了解計(jì)算機(jī)處理訊息的方法。
想象一下,你現(xiàn)在面對(duì)一堆看似毫無規(guī)律可循的數(shù)字,然后你接到了任務(wù)——數(shù)字中間藏著一個(gè)人,來,把他找出來。這就是計(jì)算機(jī)要干的事情,它得在數(shù)字里找到規(guī)律,發(fā)現(xiàn)這個(gè)藏在數(shù)字當(dāng)中的人,或者一只貓、一朵花。哦,對(duì)了,你還得先告訴計(jì)算機(jī),長(zhǎng)成這樣的是人,長(zhǎng)成那樣的是貓,有著花瓣的這株植物叫“花”,也是夠費(fèi)勁了。
在日常生活的真實(shí)場(chǎng)景中,這堆數(shù)字經(jīng)常有缺陷:比如有待識(shí)別的物體被遮住了,光照條件不同了,拍攝角度變了……所有這些,都能改變數(shù)字的規(guī)律。
美圖秀秀、人臉識(shí)別,都是計(jì)算機(jī)視覺
那么,計(jì)算機(jī)的底層和高層視覺技術(shù),又是什么呢?
底層視覺,可以幫計(jì)算機(jī)進(jìn)行邊緣提取,進(jìn)行區(qū)塊分隔,讓它看清圖像。其實(shí),只要你曾用過Photoshop或者美圖秀秀,那么你已經(jīng)感受過計(jì)算機(jī)底層視覺技術(shù)的魅力了——這些應(yīng)用都采用了圖像增強(qiáng)和圖像處理技術(shù)。
而且,如果計(jì)算機(jī)遇到了不那么清晰的畫面,底層視覺技術(shù)就會(huì)對(duì)它進(jìn)行預(yù)處理,豐富細(xì)節(jié),提高清晰度;然后高層視覺技術(shù)就能對(duì)畫面進(jìn)行更充分的特點(diǎn)提取,把圖像上的物體“認(rèn)出來”。
至于高層視覺技術(shù),目前最為人所知的應(yīng)用,當(dāng)屬人臉識(shí)別。
隨著人工智能、并行處理和神經(jīng)元網(wǎng)絡(luò)等學(xué)科的發(fā)展,人臉識(shí)別也從實(shí)驗(yàn)室走向了工業(yè)界。2015年,人臉識(shí)別的熱度一路高歌猛進(jìn):年初,馬云展示了一次“刷臉”支付技術(shù);年末,人臉識(shí)別攪動(dòng)娛樂圈,趙薇老公因司機(jī)騙過人臉識(shí)別“被賣房”……
不過,很多業(yè)內(nèi)人士仍有疑問:計(jì)算機(jī)視覺在許多應(yīng)用領(lǐng)域還是只充當(dāng)輔助角色——有它挺好,沒它也無妨。而且,識(shí)別的穩(wěn)定性仍有待提升。
戴宇榮覺得,這并不意味著計(jì)算機(jī)視覺應(yīng)用的普及依然遙遠(yuǎn)。“以計(jì)算機(jī)為例,上世紀(jì)八十年代之前,它笨重、巨大,使用復(fù)雜,處在一種不溫不火的狀態(tài)。然而,僅僅20年過去,計(jì)算機(jī)就成為家庭標(biāo)配。”
到了大學(xué)教授去工業(yè)界發(fā)展的時(shí)候?
“深度學(xué)習(xí)技術(shù)將為計(jì)算機(jī)視覺帶來更大的突破。只要我們能夠找到合適的深度學(xué)習(xí)方法,計(jì)算機(jī)視覺在日常生活中的應(yīng)用會(huì)更普及。”戴宇榮對(duì)自己傾心研究的技術(shù)很樂觀。
但是,如何找到這個(gè)方法?一些人的選擇是,離開高校,到公司去。“當(dāng)研究成果到了比較成熟、可以在工業(yè)界產(chǎn)生應(yīng)用的時(shí)候,便是大學(xué)教授到工業(yè)界發(fā)展的時(shí)候。”
戴宇榮覺得,現(xiàn)在到了這個(gè)時(shí)候。其實(shí),許多計(jì)算機(jī)視覺領(lǐng)域的學(xué)界明星也已經(jīng)“縱身一躍”,加入工業(yè)界:紐約大學(xué)的Yann LeCun去了Facebook 的人工智能研究院并擔(dān)任院長(zhǎng);NEC 資深科學(xué)家余凱進(jìn)入百度的深度學(xué)習(xí)研究院……
“公司的產(chǎn)品可以獲得大量數(shù)據(jù)以便訓(xùn)練更好的深度學(xué)習(xí)模型;它更大的計(jì)算機(jī)集群還可以加速深度學(xué)習(xí)模型的訓(xùn)練。”戴宇榮強(qiáng)調(diào),要將研究成果帶入工業(yè)界,需要多個(gè)部門通力合作,這不是簡(jiǎn)單的申請(qǐng)專利或開放源代碼就能做到的。而且,公司的人才招聘著眼長(zhǎng)遠(yuǎn),研究團(tuán)隊(duì)彼此之間能夠長(zhǎng)期合作。他認(rèn)為,比起大學(xué),一所科技類公司確實(shí)更能給科研人員提供資源和人才上的助力。
如今,計(jì)算機(jī)視覺技術(shù)已被廣泛應(yīng)用到圖像搜索領(lǐng)域;它還可以在智能安防和智能家居上一展身手;再遠(yuǎn)一些,計(jì)算機(jī)視覺將成為無人車和無人機(jī)的眼睛,助推無人貨運(yùn)的普及……戴宇榮覺得,未來正在加速前來。
摘自 中國(guó)科技網(wǎng)