“英特爾中國研究院開放日”今天在北京舉行,英特爾中國研究院院長宋繼強(qiáng)率領(lǐng)團(tuán)隊集體亮相,共同分享了英特爾中國研究院的整體定位、研究方向和創(chuàng)新機(jī)制,并展示了在人工智能、機(jī)器人、5G、虛擬現(xiàn)實等一系列前瞻科技領(lǐng)域的最新研究成果。
作為英特爾英特爾研究院在海外設(shè)立的三個“地區(qū)性的研究機(jī)構(gòu)”之一,英特爾中國研究院 (Intel Labs China, ILC) 目前主要聚焦于研究與未來自主系統(tǒng)相關(guān)的關(guān)鍵技術(shù),包括人工智能算法、自主系統(tǒng)平臺和智能基礎(chǔ)設(shè)施三大部分。
英特爾中國研究院院長宋繼強(qiáng)介紹研究院定位及最新成果
英特爾中國研究院院長宋繼強(qiáng)表示,“英特爾中國研究院致力于打造世界一流的工業(yè)研究院,通過突破性的成果打造英特爾的創(chuàng)新引擎,保持英特爾的技術(shù)領(lǐng)先性。它不僅著眼于未來革命性的科技研究,還承載著將研究成果轉(zhuǎn)化至全球及中國本土創(chuàng)新產(chǎn)品的使命。我們既要作務(wù)實的探險家,又要作大膽的實踐者。面向未來,我們將始終秉承英特爾50年來推動摩爾定律的精神來加速推動創(chuàng)新,推動產(chǎn)業(yè)和社會向前發(fā)展,讓科技的進(jìn)步普惠每一位世界公民。”
英特爾中國研究院代表介紹研究院主要研究方向
與視覺理解相關(guān)的人工智能算法:讓機(jī)器更懂你
該研究方向主要包括人臉識別技術(shù)、情緒識別、場景理解等技術(shù)以及深度神經(jīng)網(wǎng)絡(luò)壓縮技術(shù)。基于先進(jìn)的人工智能算法,英特爾中國研究院開發(fā)了視覺內(nèi)容理解和視覺內(nèi)容創(chuàng)建能力,能夠創(chuàng)造前所未有的體驗。前瞻性的視覺理解、視覺認(rèn)知主要涉及三個方面:人臉分析和情感識別;針對視覺識別高效的視覺壓縮;視覺、語言和知識融合。在此次開放日活動中,英特爾中國研究院的專家重點介紹了三個方面的最新技術(shù)進(jìn)展。
人臉分析及情感識別技術(shù):在人臉分析和情感識別方面,英特爾中國研究院很早便擁有最先進(jìn)的算法,并且在 EmotiW 比賽(自然環(huán)境下的情感識別比賽)中獲得冠軍,該算法的速度是第二名團(tuán)隊的200倍,可以應(yīng)用于無人駕駛的場景當(dāng)中。基于英特爾實時人像風(fēng)格遷移系統(tǒng),英特爾中國研究院將多種藝術(shù)人像風(fēng)格實時遷移到靜態(tài)的目標(biāo)圖像以及動態(tài)的目標(biāo)視頻中。該項技術(shù)可以廣泛地應(yīng)用于 AR/VR、在線直播、影視、多媒體社交等領(lǐng)域。此外,英特爾中國研究院基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法開發(fā)了英特爾 3D 人臉面部表情捕捉技術(shù)。英特爾研究員們從數(shù)十萬人臉圖片數(shù)據(jù)中,訓(xùn)練出多個人臉識別模型,用于對視頻圖像進(jìn)行智能分析與 3D 建模,不僅可以檢測與識別人臉,還能精準(zhǔn)重建 3D 人臉,并實時跟蹤面部表情變化,將預(yù)先設(shè)計好的特效素材附著在 3D 人臉上并疊加到視頻中,從而實現(xiàn)逼真炫酷的臉部特效。
深度神經(jīng)網(wǎng)絡(luò)壓縮技術(shù):當(dāng)前,深度學(xué)習(xí)領(lǐng)域目前面臨的一大挑戰(zhàn)是,主流 DNNs 都是計算和存儲密集型的,這導(dǎo)致在邊緣和嵌入式設(shè)備的部署面臨巨大的挑戰(zhàn)。為此,英特爾中國研究院提出了從動態(tài)網(wǎng)絡(luò)手術(shù) DNS、漸進(jìn)網(wǎng)絡(luò)量化 INQ 到 MLQ 多尺度編碼量化的低精度深度壓縮解決方案。通過這“三部曲”,可以獲得百倍 DNN 模型無損壓縮性能。根據(jù) AlexNet 測試結(jié)果,該項簡潔的解決方案能夠超越主流深度壓縮方案至少一倍,在 2/4-bit 精度下達(dá)到超過100倍的網(wǎng)絡(luò)壓縮。
多模態(tài)圖像視頻解析:近年來,如何自動生成視頻描述引起了研究人員的廣泛興趣。人們希望計算機(jī)在看到一段視頻的時候,可以根據(jù)視頻的內(nèi)容“講故事”。但是,視頻描述模型的訓(xùn)練通常需要大量復(fù)雜的并且?guī)в幸欢ㄖ饔^性的人工標(biāo)注。而在目前的數(shù)據(jù)集構(gòu)建過程中,標(biāo)注人員會在看過一段視頻之后,用一句話描述視頻的內(nèi)容。但是,一段視頻通常會發(fā)生幾個不同的事件,而由于標(biāo)注人員具有一定主觀性,人們既不知道其描述的是哪個事件,也不知道其所描述的事件對應(yīng)不同幀上的哪個區(qū)域。為此,英特爾中國研究院率先提出了弱監(jiān)督視頻密集描述生成的方法,不需要訓(xùn)練數(shù)據(jù)對視頻中的不同事件和對應(yīng)區(qū)域進(jìn)行分別標(biāo)注,而僅僅使用標(biāo)注員對視頻的一句話描述,就可以自動產(chǎn)生多角度的視頻描述,并且從中挑選出最具代表性的描述語句。這樣,計算機(jī)就不用人“手把手教”,而是可以做到“舉一反三”。
自主系統(tǒng):創(chuàng)造機(jī)器人的“英雄”時代
自主系統(tǒng)是與人工智能相關(guān)的一個研究方向。英特爾中國研究院的目標(biāo)是推出一套基于 CPU+FPGA 異構(gòu)計算的自主智能機(jī)器人開發(fā)平臺,幫助研究人員基于此平臺進(jìn)行開發(fā)。之所以引入異構(gòu)平臺,是因為機(jī)器人研究需要同時引入時間和空間計算模型。CPU 作為時間計算模型的完美代表,指令按時間順序一條一條執(zhí)行,可以實現(xiàn)靈活多變的控制;加速器則更像一種空間計算模型,利用空間的并行從而一次性完成大量數(shù)據(jù)處理,使復(fù)雜的計算得到加速處理。
基于這一目標(biāo),HERO 智能機(jī)器人開放平臺 (Heterogeneous Extensible Robot Open Platform) 應(yīng)運而生。它是英特爾中國研究院專為智能機(jī)器人(包括服務(wù)機(jī)器人、醫(yī)療機(jī)器人、自動駕駛汽車等)打造的一套低功耗、高性能、體積小的異構(gòu)系統(tǒng)平臺方案。在此方案中,CPU 作為控制中心,與 FPGA 和其它專用加速器芯片(如 Movidius 的 VPU )搭配,能夠提供高效的性能。整套 HERO 硬件系統(tǒng)采用了英特爾酷睿系列 CPU,搭載英特爾 Arria 10 GX 系列1150型 FPGA 作為異構(gòu)加速器,能夠?qū)崟r處理大量數(shù)據(jù)并運行多種智能算法。
在本次開放日活動上,英特爾中國研究院宣布圍繞 HERO 平臺推出全新的合作伙伴計劃。圍繞該項計劃,英特爾中國研究院致力于攜手業(yè)界的平臺級、應(yīng)用級和生態(tài)級合作伙伴,通過研發(fā)合作、學(xué)術(shù)創(chuàng)新和行業(yè)示范,共同打造一套完整、高效和開放的平臺,不斷擴(kuò)展應(yīng)用場景,加速技術(shù)和產(chǎn)品的落地。
智能基礎(chǔ)設(shè)施:加速通信和計算的融合
該項研究主要面向保障未來大規(guī)模智能聯(lián)網(wǎng)設(shè)備順利工作的支撐技術(shù),包括無線通信技術(shù)和智能存儲技術(shù)。前者研究在網(wǎng)絡(luò)接入端的 MIMO 技術(shù)和移動邊緣計算技術(shù);后者研究使用英特爾最新的 3D 存儲技術(shù)和 FPGA 構(gòu)建的智能化方案來提供高吞吐量、低延遲、有增值服務(wù)潛力的技術(shù)。
在本次開放日活動中,英特爾介紹了如何面向 5G 下一代通信網(wǎng)絡(luò),借助通信與計算的融合打造高質(zhì)量的 VR 體驗。當(dāng)前,為了滿足高質(zhì)量虛擬現(xiàn)實體驗的需求,當(dāng)下的高清體驗需要實現(xiàn)25-40倍的分辨率提升。為此,英特爾希望通過計算和網(wǎng)絡(luò)的融合,以端到端方式實現(xiàn)網(wǎng)絡(luò)擴(kuò)容,從而打造遠(yuǎn)程沉浸式的互動體驗。英特爾演示了超高分辨率全景視頻采集系統(tǒng),它主要適用于無線 VR 設(shè)備,用戶可以身臨其境地觀賞全景視頻,或者參與 VR 游戲互動。它使用了 ISP 總線同步相機(jī)快門,通過分布式構(gòu)架處理采樣圖像,同時利用光流法拼接全景視頻,并插值立體信息。該系統(tǒng)同時采用英特爾核心 GPU 高性能壓縮圖像,通過無線傳輸將主機(jī)渲染輸出到遠(yuǎn)程終端,并利用 OFFLOAD 技術(shù)降低顯示延遲。有了這些技術(shù),電視觀眾即使在家里也能感受到奧運會前排座席的觀賽體驗,或者選擇場館內(nèi)不同的觀賽角度。
關(guān)于英特爾
英特爾致力于拓展科技疆界,讓最佳精彩體驗成為可能。-