“英特爾中國研究院開放日”今天在北京舉行,英特爾中國研究院院長宋繼強率領團隊集體亮相,共同分享了英特爾中國研究院的整體定位、研究方向和創新機制,并展示了在人工智能、機器人、5G、虛擬現實等一系列前瞻科技領域的最新研究成果。
作為英特爾英特爾研究院在海外設立的三個“地區性的研究機構”之一,英特爾中國研究院 (Intel Labs China, ILC) 目前主要聚焦于研究與未來自主系統相關的關鍵技術,包括人工智能算法、自主系統平臺和智能基礎設施三大部分。
英特爾中國研究院院長宋繼強介紹研究院定位及最新成果
英特爾中國研究院院長宋繼強表示,“英特爾中國研究院致力于打造世界一流的工業研究院,通過突破性的成果打造英特爾的創新引擎,保持英特爾的技術領先性。它不僅著眼于未來革命性的科技研究,還承載著將研究成果轉化至全球及中國本土創新產品的使命。我們既要作務實的探險家,又要作大膽的實踐者。面向未來,我們將始終秉承英特爾50年來推動摩爾定律的精神來加速推動創新,推動產業和社會向前發展,讓科技的進步普惠每一位世界公民。”
英特爾中國研究院代表介紹研究院主要研究方向
與視覺理解相關的人工智能算法:讓機器更懂你
該研究方向主要包括人臉識別技術、情緒識別、場景理解等技術以及深度神經網絡壓縮技術。基于先進的人工智能算法,英特爾中國研究院開發了視覺內容理解和視覺內容創建能力,能夠創造前所未有的體驗。前瞻性的視覺理解、視覺認知主要涉及三個方面:人臉分析和情感識別;針對視覺識別高效的視覺壓縮;視覺、語言和知識融合。在此次開放日活動中,英特爾中國研究院的專家重點介紹了三個方面的最新技術進展。
人臉分析及情感識別技術:在人臉分析和情感識別方面,英特爾中國研究院很早便擁有最先進的算法,并且在 EmotiW 比賽(自然環境下的情感識別比賽)中獲得冠軍,該算法的速度是第二名團隊的200倍,可以應用于無人駕駛的場景當中。基于英特爾實時人像風格遷移系統,英特爾中國研究院將多種藝術人像風格實時遷移到靜態的目標圖像以及動態的目標視頻中。該項技術可以廣泛地應用于 AR/VR、在線直播、影視、多媒體社交等領域。此外,英特爾中國研究院基于機器學習和深度學習算法開發了英特爾 3D 人臉面部表情捕捉技術。英特爾研究員們從數十萬人臉圖片數據中,訓練出多個人臉識別模型,用于對視頻圖像進行智能分析與 3D 建模,不僅可以檢測與識別人臉,還能精準重建 3D 人臉,并實時跟蹤面部表情變化,將預先設計好的特效素材附著在 3D 人臉上并疊加到視頻中,從而實現逼真炫酷的臉部特效。
深度神經網絡壓縮技術:當前,深度學習領域目前面臨的一大挑戰是,主流 DNNs 都是計算和存儲密集型的,這導致在邊緣和嵌入式設備的部署面臨巨大的挑戰。為此,英特爾中國研究院提出了從動態網絡手術 DNS、漸進網絡量化 INQ 到 MLQ 多尺度編碼量化的低精度深度壓縮解決方案。通過這“三部曲”,可以獲得百倍 DNN 模型無損壓縮性能。根據 AlexNet 測試結果,該項簡潔的解決方案能夠超越主流深度壓縮方案至少一倍,在 2/4-bit 精度下達到超過100倍的網絡壓縮。
多模態圖像視頻解析:近年來,如何自動生成視頻描述引起了研究人員的廣泛興趣。人們希望計算機在看到一段視頻的時候,可以根據視頻的內容“講故事”。但是,視頻描述模型的訓練通常需要大量復雜的并且帶有一定主觀性的人工標注。而在目前的數據集構建過程中,標注人員會在看過一段視頻之后,用一句話描述視頻的內容。但是,一段視頻通常會發生幾個不同的事件,而由于標注人員具有一定主觀性,人們既不知道其描述的是哪個事件,也不知道其所描述的事件對應不同幀上的哪個區域。為此,英特爾中國研究院率先提出了弱監督視頻密集描述生成的方法,不需要訓練數據對視頻中的不同事件和對應區域進行分別標注,而僅僅使用標注員對視頻的一句話描述,就可以自動產生多角度的視頻描述,并且從中挑選出最具代表性的描述語句。這樣,計算機就不用人“手把手教”,而是可以做到“舉一反三”。
自主系統:創造機器人的“英雄”時代
自主系統是與人工智能相關的一個研究方向。英特爾中國研究院的目標是推出一套基于 CPU+FPGA 異構計算的自主智能機器人開發平臺,幫助研究人員基于此平臺進行開發。之所以引入異構平臺,是因為機器人研究需要同時引入時間和空間計算模型。CPU 作為時間計算模型的完美代表,指令按時間順序一條一條執行,可以實現靈活多變的控制;加速器則更像一種空間計算模型,利用空間的并行從而一次性完成大量數據處理,使復雜的計算得到加速處理。
基于這一目標,HERO 智能機器人開放平臺 (Heterogeneous Extensible Robot Open Platform) 應運而生。它是英特爾中國研究院專為智能機器人(包括服務機器人、醫療機器人、自動駕駛汽車等)打造的一套低功耗、高性能、體積小的異構系統平臺方案。在此方案中,CPU 作為控制中心,與 FPGA 和其它專用加速器芯片(如 Movidius 的 VPU )搭配,能夠提供高效的性能。整套 HERO 硬件系統采用了英特爾酷睿系列 CPU,搭載英特爾 Arria 10 GX 系列1150型 FPGA 作為異構加速器,能夠實時處理大量數據并運行多種智能算法。
在本次開放日活動上,英特爾中國研究院宣布圍繞 HERO 平臺推出全新的合作伙伴計劃。圍繞該項計劃,英特爾中國研究院致力于攜手業界的平臺級、應用級和生態級合作伙伴,通過研發合作、學術創新和行業示范,共同打造一套完整、高效和開放的平臺,不斷擴展應用場景,加速技術和產品的落地。
智能基礎設施:加速通信和計算的融合
該項研究主要面向保障未來大規模智能聯網設備順利工作的支撐技術,包括無線通信技術和智能存儲技術。前者研究在網絡接入端的 MIMO 技術和移動邊緣計算技術;后者研究使用英特爾最新的 3D 存儲技術和 FPGA 構建的智能化方案來提供高吞吐量、低延遲、有增值服務潛力的技術。
在本次開放日活動中,英特爾介紹了如何面向 5G 下一代通信網絡,借助通信與計算的融合打造高質量的 VR 體驗。當前,為了滿足高質量虛擬現實體驗的需求,當下的高清體驗需要實現25-40倍的分辨率提升。為此,英特爾希望通過計算和網絡的融合,以端到端方式實現網絡擴容,從而打造遠程沉浸式的互動體驗。英特爾演示了超高分辨率全景視頻采集系統,它主要適用于無線 VR 設備,用戶可以身臨其境地觀賞全景視頻,或者參與 VR 游戲互動。它使用了 ISP 總線同步相機快門,通過分布式構架處理采樣圖像,同時利用光流法拼接全景視頻,并插值立體信息。該系統同時采用英特爾核心 GPU 高性能壓縮圖像,通過無線傳輸將主機渲染輸出到遠程終端,并利用 OFFLOAD 技術降低顯示延遲。有了這些技術,電視觀眾即使在家里也能感受到奧運會前排座席的觀賽體驗,或者選擇場館內不同的觀賽角度。
關于英特爾
英特爾致力于拓展科技疆界,讓最佳精彩體驗成為可能。-