近日,華為和比特大陸紛紛發(fā)布了針對邊緣計算的新芯片產(chǎn)品。華為的Ascend系列采用達(dá)芬奇架構(gòu),其中Ascend 310功耗8W算力8TOPS正是針對邊緣計算市場。而之后比特大陸發(fā)布的BM1682和BM1880也是針對邊緣計算市場,其中BM1682功耗30W算力3TFlops針對邊緣服務(wù)器市場,而BM1880功耗3W整數(shù)算力2TOPS則是針對邊緣終端市場。人工智能結(jié)合邊緣計算已經(jīng)成為最熱門的市場之一,我們今天就來分析并展望這個市場。
華為和比特大陸都紛紛在邊緣人工計算市場布局
邊緣計算新興市場
人工智能芯片市場第一個得到關(guān)注的是云端服務(wù)器市場,Nvidia的GPU以其強(qiáng)勁的算力掌握了大部分市場。隨著人工智能的鋪開,邊緣計算(edge computing)的概念也得到了越來越多的認(rèn)可。邊緣計算相對于云計算有幾點優(yōu)勢,首先是延遲較小,在云端和終端通常有幾十毫秒到幾百毫秒不等的網(wǎng)絡(luò)延遲,對于工業(yè)應(yīng)用等對延遲有高要求的應(yīng)用來說云端部署人工智能無法滿足其對于延遲的需求;其次是數(shù)據(jù)隱私,有些應(yīng)用不希望把數(shù)據(jù)傳輸?shù)皆贫耍环矫鎿?dān)心云端數(shù)據(jù)被云運營商看到,另一方面擔(dān)心數(shù)據(jù)傳輸過程中被黑客劫持;最后是可靠性,如果把人工智能部署在云端那么一旦網(wǎng)絡(luò)斷了在終端的人工智能程序就無法工作了,這對于要求高可靠性的應(yīng)用來說難以滿足要求,但是如果把人工智能部署在邊緣就沒有這個問題。
邊緣人工智能計算中其實還包含了多個層次,一種是終端設(shè)備(如手機(jī))上的人工智能計算,這樣的規(guī)劃把人工智能計算直接放到終端設(shè)備上,可以實現(xiàn)最低的延遲。然而,由于終端設(shè)備的電池容量有限或者對于散熱容忍度較低,因此在終端設(shè)備上做人工智能計算對于AI芯片的能效比提出了極高的要求,同時這樣也并非唯一的邊緣計算形態(tài)。
除了終端設(shè)備上的直接做計算之外,還可以把終端的數(shù)據(jù)放到離終端比較近的本地服務(wù)器去計算。例如,對于工業(yè)應(yīng)用這樣的對于穩(wěn)定性和延遲有要求但是又可以做集群化計算的應(yīng)用,除了把計算直接放到終端設(shè)備之外另一種方法就是就近設(shè)立邊緣服務(wù)器讓計算放到邊緣服務(wù)器上去做然后快速返回給終端設(shè)備。邊緣服務(wù)器對于芯片功耗的要求相比在終端設(shè)備上直接計算就會寬松許多,因此非常適合于這種可以集群化計算的應(yīng)用。
邊緣計算的兩種市場目前都已經(jīng)在起飛。而相關(guān)AI芯片也得到了許多關(guān)注。標(biāo)志性事件是華為的兩次芯片發(fā)布會。去年秋天發(fā)布的麒麟970芯片附帶NPU,可以說是人工智能部署在手機(jī)的一次重要嘗試。今年秋天又發(fā)布了Ascend系列芯片,其中Ascend 310芯片也是針對邊緣服務(wù)器市場并且華為已經(jīng)開發(fā)了基于Ascend 310的邊緣計算服務(wù)器準(zhǔn)備部署在自動駕駛領(lǐng)域。因此我們可以預(yù)計在未來無論是相關(guān)應(yīng)用還是相關(guān)芯片都將有更多公司大手筆投入,從而推動AI進(jìn)一步發(fā)展。
邊緣服務(wù)器的芯片形態(tài)與競爭格局
邊緣服務(wù)器的市場現(xiàn)在來看將是人工智能最早落地的應(yīng)用 之一(甚至比手機(jī)里的人工智能還要早且成熟),因為目前中國的智能攝像頭產(chǎn)品已經(jīng)在安防、人臉識別等領(lǐng)域真正落地,而邊緣服務(wù)器是很適合智能攝像頭的產(chǎn)品形態(tài),一方面在不少此類應(yīng)用中對于可靠性有很強(qiáng)的需求,因此部署在邊緣端的人工智能更適合;另一方面智能攝像頭的計算可以集群化操作,因此一個邊緣服務(wù)器處理多路智能攝像頭的形式是非常經(jīng)濟(jì)的方式。除了智能攝像頭之外,無人駕駛也是邊緣服務(wù)器的一個例子,因為在無人車?yán)锩嫘枰鰝鞲衅魅诤献龃罅坑嬎悖喈?dāng)于在無人車上部署了一個邊緣服務(wù)器。
邊緣服務(wù)器市場通常對于通用性有一定需求,因此比較合適的方案是處理器加上通用型深度學(xué)習(xí)加速芯片,而深度學(xué)習(xí)加速芯片最常見的形式是以PCIe加速卡的形式插到主板上,并與主處理器協(xié)同工作。值得注意的是,由于邊緣服務(wù)器對于人工智能算法精度有一定要求,因此往往使用的是類似半精度浮點數(shù)的運算方式,很多邊緣終端芯片上常見的INT-4甚至INT-2等激進(jìn)的低精度整數(shù)運算由于損失精度過多因此在邊緣服務(wù)器不太適合。
我們認(rèn)為邊緣服務(wù)器市場尚屬于新興市場,加入戰(zhàn)場的公司并不多,目前僅有Nvidia,華為,比特大陸等, 而且不同的公司可以主打不同的細(xì)分市場,因此市場競爭遠(yuǎn)未飽和。我們不妨來分析一下Nvidia,華為和比特大陸三家公司的競爭格局。Nvidia的產(chǎn)品是Xavier芯片,峰值算力30TOPS,功耗30W,主要針對的是自動駕駛市場,因此芯片上還集成了雙目視覺、光流等,模組售價2499美元,顯然是針對高端自動駕駛市場,而對于智能攝像頭等對于部署成本有要求的場合并不合適。
華為的Ascend 310定位中高端,其8W/8TFlops的性能下可覆蓋智能攝像頭市場,上可進(jìn)擊自動駕駛市場(華為已經(jīng)與奧迪合作,發(fā)布了基于Ascend 310芯片的自動駕駛邊緣服務(wù)器MDC600)。而比特大陸則是主打性價比路線,BM1682自帶視頻解碼和后處理操作且集成了CPU,因此客戶需要加速智能機(jī)器視覺相關(guān)應(yīng)用時理論上只需要BM1682即可,無需再去購入額外的CPU,這也降低了成本。
華為基于Ascend 310的MDC600邊緣計算服務(wù)器主攻自動駕駛市場
目前在中國市場,最主要的市場還是安防等應(yīng)用的智能攝像頭,因此產(chǎn)品定位決定了主要是華為和比特大陸之間的競爭,那么比特大陸和華為之間的競爭格局會如何呢?我們認(rèn)為,首先這個市場很大,華為和比特大陸的主打方向也不相同(華為主打性能而比特大陸走性價比路線),因此并不存在勢不兩立的激烈競爭。另一方面,其實華為和比特大陸的共同競爭對手是海康威視這樣的智能攝像頭系統(tǒng)廠商,一旦海康威視也開始自研芯片且在自己的安全攝像頭系統(tǒng)中以各種方式推廣自研邊緣服務(wù)器,那么華為和比特大 陸的壓力將會很大。不過我們預(yù)計到那個時候智能攝像頭以外的市場也會變得成熟,從而給華為和比特大陸等芯片公司提供新的機(jī)會,而不用被迫在智能攝像頭領(lǐng)域與巨頭系統(tǒng)廠商競爭。
邊緣終端市場的芯片形態(tài)與競爭格局
邊緣終端市場是指直接在終端設(shè)備上做計算的AI芯片,對于功耗和能效比有很強(qiáng)的要求。目前來看,邊緣終端市場有兩種形態(tài)的芯片產(chǎn)品,一種是針對特定應(yīng)用的SoC,一種是通用加速器做獨立芯片。SoC面向?qū)S檬袌觯谛酒猩疃葘W(xué)習(xí)加速計算事實上只是一小部分,而其他大部分芯片面積則交給了主控處理器、視頻解碼等等模塊。SoC集成度高,一般的技術(shù)路線是用新的SoC代替原有的不支持深度學(xué)習(xí)加速的SoC做更新?lián)Q代。
一個典型的例子就是華為麒麟系列SoC加入寒武紀(jì)的NPU,就屬于SoC自己的更新?lián)Q代。專注于AI芯片的廠商進(jìn)入SoC市場的策略往往是提供IP授權(quán),以發(fā)揮自己的強(qiáng)項(如寒武紀(jì)給華為提供NPU IP)。對于SoC往往針對的是一個特定市場,因為其中的模塊都是針對該應(yīng)用而設(shè)計,如果用在其他應(yīng)用中則顯得浪費,例如麒麟SoC最適合的場景是手機(jī),其中包含的GPU、ISP、Modem等都是為了手機(jī)場景打造,如果是用在工業(yè)場景則這些模組都閑置了,因此也就引出了另一個終端通用型深度學(xué)習(xí)加速器芯片市場。該市場相對于SoC市場來說允許較低的集成度,即可以在主控芯片之外再搭配額外的芯片以支持相應(yīng)功能。
在終端SoC市場,事實上競爭已經(jīng)白熱化,華為、高通等公司都紛紛推出專屬的SoC搭載 AI加速模組,而AI加速模組IP的提供商也有ARM,Cadence,CEVA等傳統(tǒng)IP提供商以及寒武紀(jì)這樣的初創(chuàng)公司。不少傳統(tǒng)SoC芯片公司都紛紛在自家SoC中加入自研或授權(quán)的人工智能模塊。對于人工智能終端SoC市場,我們的分析是該市場雖然最早得到關(guān)注但是很可能近幾年還是被原來的SoC公司占領(lǐng)市場,因為目前終端人工智能市場尚未真正落地收獲真金白銀,因此SoC中加入人工智能還只是錦上添花之舉。
在IP授權(quán)方面,Cadence和ARM入局意味著小公司面臨巨大壓力,因為IP市場存在一定的頭部效應(yīng),且Cadence和ARM可以通過與其他的優(yōu)勢IP做捆綁銷售來推銷其人工智能IP,在人工智能并非最關(guān)鍵SoC模組的市場現(xiàn)狀下,小公司想要與Cadence和ARM等巨頭競爭只能走差異化,例如超低功耗或模擬計算等路線。
終端通用深度學(xué)習(xí)加速器芯片市場的應(yīng)用則剛起步,之前Movidius推出的神經(jīng)計算加速棒并未引起巨大反響。但是這并不代表這個市場不存在,而是還處于幼年期,需要培養(yǎng),因此許多公司在這個市場布局主要一是培養(yǎng)開發(fā)者生態(tài),另一方面也探索研究哪個市場最有潛力,預(yù)計在市場成熟之后再收縮戰(zhàn)線,針對幾個重要的應(yīng)用推出相應(yīng)的優(yōu)化芯片,從而占領(lǐng)最合適的市場。因此,目前對于這個市場最合適的策略是推出開發(fā)板和插件式加速硬件(如USB加速棒)這樣簡單易用的產(chǎn)品,這樣廠商和客戶可以一起探索市場需求,決定最佳產(chǎn)品形態(tài)。 我們看到比特大陸就是在這個市場跟隨Movidius推出了BM1880芯片,并配套推出了開發(fā)板、芯片模組以及USB加速棒等多種硬件形態(tài)供客戶挑選,我們相信在近期將會看到通用型終端人工智能加速器的更多應(yīng)用。
未來發(fā)展預(yù)期
如之前的分析,我們預(yù)計在人工智能邊緣計算會成為未來最重要的人工智能硬件市場之一。在邊緣計算領(lǐng)域,邊緣服務(wù)器芯片市場非常重要但是目前廠商不多,我們預(yù)期會有不少公司入局,包括從芯片領(lǐng)域提出超高性能的初創(chuàng)公司,以及海康威視這樣的系統(tǒng)廠商開始自研芯片,而如華為、比特大陸等已經(jīng)提前入場的公司也會繼續(xù)加大投入。
在終端邊緣計算市場,SoC芯片(AI加速器IP)領(lǐng)域競爭已經(jīng)非常激烈,未來恐怕會有一波洗牌的過程,最后只會剩下幾家能在不同細(xì)分市場牢牢把握住客戶的公司。在通用終端加速器芯片領(lǐng)域我們則可望看到更多應(yīng)用出現(xiàn),在未來幾年內(nèi)我們能看到的邊緣終端加速器應(yīng)用實際上將會很大程度上決定這個市場的具體規(guī)模。
最后,我們必須看到邊緣計算等人工智能芯片應(yīng)用目前最大的市場其實在中國。這是因為中國的人工智能落地情況遠(yuǎn)好于美國。在政府的支持下,曠視、商湯、依圖等初創(chuàng)企業(yè)紛紛推出優(yōu)秀的產(chǎn)品并在市場上站住了腳跟,這一方面加速了基于人工智能的應(yīng)用成熟,另一方面也給人工智能芯片帶來了市場,從而為人工智能的完整產(chǎn)業(yè)鏈的成熟帶來了機(jī)會。我們可以肯定地說,人工智能芯片的未來還得要看中國。
來源:半導(dǎo)體行業(yè)觀察