1 目標(biāo)和概述
當(dāng)前邊緣計(jì)算設(shè)備普遍強(qiáng)通訊弱計(jì)算,其算力通常有限。隨著云計(jì)算、人工智能等技術(shù)的興起和廣泛應(yīng)用,邊緣計(jì)算在應(yīng)對更多聯(lián)接、更高實(shí)時(shí)性要求、海量異構(gòu)數(shù)據(jù)處理上,對邊緣算力需求也顯著增長;同時(shí)邊緣計(jì)算因?yàn)槠洳渴饤l件限制,對服務(wù)器在環(huán)境適配性、部署運(yùn)維上有更嚴(yán)苛要求;面對海量邊緣應(yīng)用場景,作為軟件基礎(chǔ)平臺的操作系統(tǒng)尤為重要,向下要能充分發(fā)揮硬件算力,向上能使能海量應(yīng)用。
基于上述挑戰(zhàn),鯤鵬軟硬協(xié)同邊緣計(jì)算平臺, 從處理器、服務(wù)器和操作系統(tǒng)三個(gè)層面,打造適用于邊緣計(jì)算的融合統(tǒng)一計(jì)算平臺,為邊緣計(jì)算在智能園區(qū)、電力能源、工業(yè)制造和游戲直播等多個(gè)行業(yè)發(fā)展提供動能。
2 解決方案介紹
鯤鵬軟硬協(xié)同邊緣計(jì)算平臺,主要包含鯤鵬920 處理器、TaiShan200邊緣型服務(wù)器(型號2280E)和openEuler服務(wù)器操作系統(tǒng)三個(gè)方面。
2.1 鯤鵬920高性能處理器
鯤鵬920高性能處理器具備高性能、高吞吐、高集成和高能效的特點(diǎn),為邊緣計(jì)算應(yīng)用場景提供充足算力。
圖1 鯤鵬920處理器:多核架構(gòu)提供高性能、高并發(fā)算力
(1)高性能:鯤鵬920集成了64核,主頻提升至2.6GHz,并通過優(yōu)化分支預(yù)測算法、提升運(yùn)算單元數(shù)量、改進(jìn)內(nèi)存子系統(tǒng)架構(gòu)等一系列微架構(gòu)設(shè)計(jì),大幅提高了處理器核性能。
(2)高吞吐:為改善在低延時(shí)條件下高并發(fā)的能力, 鯤鵬920采取了三項(xiàng)措施。首先將業(yè)界DDR通道數(shù)量從6通道增加到8通道,速率從2666MHz提升至2933MHz,總帶寬達(dá)到1.5T比特每秒,超出業(yè)界主流內(nèi)存帶寬46%;其次將PCIe從3.0升級到4.0,速率翻番,帶寬達(dá)到640Gbps,比業(yè)界主流提升66%;最后將網(wǎng)口帶寬從25G直接提升到100G,帶寬翻了4倍。
(3)高集成:傳統(tǒng)服務(wù)器架構(gòu)上,CPU/南橋/網(wǎng)卡/硬盤控制器是系統(tǒng)標(biāo)配,需要4顆芯片來實(shí)現(xiàn);隨著workload的豐富多樣、異構(gòu)計(jì)算的不斷興起,在服務(wù)器層面需要更多的槽位來部署不同的業(yè)務(wù)加速部件,而槽位在服務(wù)器上是一個(gè)緊缺資源。鯤鵬920不僅是一顆通用CPU,還同時(shí)集成了南橋、網(wǎng)卡、SAS存儲控制器 等三種芯片的功能,做到業(yè)界領(lǐng)先的集成度,單顆芯片實(shí)現(xiàn)4顆芯片的功能,從而釋放出更多槽位,擴(kuò)展更多功能,大幅提高系統(tǒng)的集成度并為客戶帶來總體擁有成本上的收益。
(4)高能效:伴隨云計(jì)算、邊緣計(jì)算的興起,使得數(shù)據(jù)中心規(guī)模越來越大,從幾臺服務(wù)器、幾個(gè)機(jī)架演變成以萬臺服務(wù)器為單位的數(shù)據(jù)中心集群,占地空間和能源消耗成為大型數(shù)據(jù)中心的重要影響因素,節(jié)能具有更重要的意義。正因每個(gè)機(jī)架的供電能力是有限的,每個(gè)機(jī)架的計(jì)算能力越強(qiáng),在大規(guī)模數(shù)據(jù)中心建設(shè)時(shí)越能有效減少總體占地和減少功耗。基于鯤鵬920,在大規(guī)模數(shù)據(jù)中心業(yè)務(wù)實(shí)踐中,每萬臺服務(wù)器可每年省電1000 萬度、碳排放每年減少1萬噸。
2.2 TaiShan 200邊緣型服務(wù)器(型號2280E)
TaiShan 200邊緣型服務(wù)器(型號2280E)專為邊緣計(jì)算應(yīng)用場景設(shè)計(jì),采用鯤鵬920處理器以提供充足邊緣算力。
(1)端邊云協(xié)同計(jì)算:鯤鵬處理器兼容ARM架 構(gòu),提供強(qiáng)大多核算力;具有ARM原生指令集優(yōu)勢,提供更加高效的應(yīng)用開發(fā)和部署運(yùn)行環(huán)境,使能端邊云算力同構(gòu);
(2)多樣性計(jì)算:基于鯤鵬+昇騰芯片族構(gòu)筑多樣性計(jì)算能力,滿足邊緣場景差異化算力需求;
(3) 易部署、易運(yùn)維:機(jī)框采用短機(jī)箱設(shè)計(jì),存儲、網(wǎng)絡(luò)和風(fēng)扇等部件采用模塊化設(shè)計(jì),系統(tǒng)具有-5°C 至55°C的超寬環(huán)溫適應(yīng)性,滿足邊緣場景嚴(yán)苛的部署要求。
圖2 TaiShan 200服務(wù)器
2.3 openEuler服務(wù)器操作系統(tǒng)
openEuler服務(wù)器操作系統(tǒng)是基于鯤鵬處理器的服務(wù)器配套軟件基礎(chǔ)設(shè)施,在多核調(diào)度、軟硬協(xié)同、指令級優(yōu)化等多方面深度優(yōu)化,能最大釋放鯤鵬強(qiáng)大算力, 是鯤鵬計(jì)算產(chǎn)業(yè)中的基礎(chǔ)軟件重要組成部分。
openEuler基于Linux內(nèi)核的開源操作系統(tǒng),支持x86和ARM等多種處理器架構(gòu),適用于數(shù)據(jù)庫、大數(shù)據(jù)、云計(jì)算、人工智能及邊緣計(jì)算等場景。
圖 3 openEuler
openEuler也是一個(gè)開源的、免費(fèi)的Linux發(fā)行版平臺,致力于通過開放的社區(qū)形式,與全球的開發(fā)者共同構(gòu)建一個(gè)開放、多元和架構(gòu)包容的軟件生態(tài)體系。
作為一款通用操作系統(tǒng), openEuler除了具備當(dāng)前流行的操作系統(tǒng)的特點(diǎn)之外,同時(shí)又有自身的不同點(diǎn),尤其與鯤鵬硬件配套,實(shí)現(xiàn)大量的優(yōu)化與創(chuàng)新,具有以下五方面特點(diǎn):
(1)領(lǐng)先的多核調(diào)度技術(shù):從多核向眾核發(fā)展過程中,openEuler提供的自上而下的NUMA aware方案,提升調(diào)度性能。同時(shí)免鎖優(yōu)化, 并發(fā)增強(qiáng)等使系統(tǒng)整體性能得到明顯提升;
(2) 軟硬協(xié)同,釋放強(qiáng)勁算力:通過KAE(Kunpeng Accelerator Engine)庫,充分釋放鯤鵬硬件算力潛能,提升算力表現(xiàn)。同時(shí)通過openssl相結(jié)合,在業(yè)務(wù)零修改情況下,從CPU把加解密算力缷載到硬件加解密卡上, 降底CPU負(fù)載;
(3) 軟量級虛擬化:采用iSula和StatioVirt虛擬化技術(shù)及容器技術(shù),提供從云到邊緣的安全、靈活業(yè)務(wù)部署及編排能力,應(yīng)對復(fù)雜的業(yè)務(wù)場景;
(4)指令級優(yōu)化:對于業(yè)界主流的動態(tài)、靜態(tài)語言從指令級進(jìn)行優(yōu)化,充分利用處理器流水線,提升運(yùn)行性能;
(5)A-tune智能優(yōu)化引擎:動態(tài)智能識別操作系業(yè)務(wù)場景,匹配場景參數(shù)模型,使系統(tǒng)處在最佳運(yùn)行狀態(tài),從而提升業(yè)務(wù)性能。
3 代表性及推廣價(jià)值
鯤鵬軟硬協(xié)同邊緣計(jì)算平臺,目前已廣泛部署和應(yīng)用于交通、電力、電信、互聯(lián)網(wǎng)等多個(gè)國計(jì)民生行業(yè), 為豐富邊緣計(jì)算的應(yīng)用和更多業(yè)務(wù)創(chuàng)新提供充足算力。
(1)全國高速公路取消省界收費(fèi)站項(xiàng)目應(yīng)用
全國高速公路取消省界收費(fèi)站項(xiàng)目中,截止目前部署了超過4000臺基于鯤鵬服務(wù)器主板的服務(wù)器,其中80%部署在邊緣場景,為系統(tǒng)提供高速、高效且穩(wěn)定的算力。部署整體解決方案后,客車通行速度從15秒降低到2秒,貨車通行速度從29秒降低為3秒,大大提高了通行效率。
同時(shí)依托數(shù)字平臺能力,構(gòu)筑云邊協(xié)同、實(shí)時(shí)精準(zhǔn)收費(fèi)稽查大數(shù)據(jù)云平臺。通過ETC門架系統(tǒng)邊緣計(jì)算節(jié)點(diǎn)對車牌識別圖片、RSU(路側(cè)單元)讀取的車輛信息進(jìn)行實(shí)時(shí)分析比對,異常信息實(shí)時(shí)上報(bào)省中心并同步至相關(guān)出入口收費(fèi)站進(jìn)行實(shí)時(shí)管控,通過“省中心-ETC門架”云邊協(xié)同,實(shí)現(xiàn)實(shí)時(shí)、精準(zhǔn)收費(fèi)稽查。
(2)電力系統(tǒng)邊緣變電站監(jiān)控應(yīng)用
在某電網(wǎng)項(xiàng)目中,已建成基于鯤鵬的電網(wǎng)云平臺和數(shù)據(jù)中臺,滿足了電力物聯(lián)網(wǎng)對數(shù)字平臺的支撐需求,確保資源調(diào)配更彈性靈活、服務(wù)集成更統(tǒng)一高效、數(shù)據(jù)資源更集約共享。電網(wǎng)云和數(shù)據(jù)中臺利用現(xiàn)有平臺基礎(chǔ)開展建設(shè),云平臺減少近50%的技術(shù)組件運(yùn)維成本,資源利用率提升近2倍,實(shí)現(xiàn)了數(shù)據(jù)“可提取、可流轉(zhuǎn)、可匯集、可分析、可應(yīng)用”,可快速響應(yīng)客戶需求,為各種業(yè)務(wù)系統(tǒng)提供靈活豐富的網(wǎng)絡(luò)、計(jì)算和存儲環(huán)境。在各變電站所處的邊緣場景,通過部署鯤鵬+ openEuler軟硬協(xié)同邊緣計(jì)算平臺,實(shí)現(xiàn)對變電站各種運(yùn)行數(shù)據(jù)的搜集、分析和自動化處理,提升變電站運(yùn)行維護(hù)效率,降低運(yùn)行維護(hù)成本。
圖4 高速自由流:為智能交通提供算力支持
摘自《自動化博覽》2021年2月刊