“到2030年,所有高端計算設備將自帶人工智能(AI)支持功能,高性能計算仿真將利用人工智能平臺提高性能,人工智能也將重塑計算仿真。”近日在德國法蘭克福舉辦的國際超算大會(ISC19)上,國家超級計算廣州中心主任盧宇彤在談到未來高性能計算機(HPC)與AI的融合時表示,未來高性能計算、物聯網、大數據和人工智能將實現深度融合。
“計算是引擎,數據是燃料。”盧宇彤認為,到那時,高性能計算將不再比拼“肌肉”、只追求規模和性能,更加智慧的高性能計算系統將成為主流。
AI對計算的需求潛力大
“目前AI的發展還在智能感知階段,在智能認知方面還沒有很成熟的研究。從這個角度而言,AI對計算能力的需求,潛力非常大。”國家并行計算機工程技術研究中心總工程師、中國工程院院士陳左寧曾在2018年10月下旬舉辦的第十四屆全國高性能計算學術年會上專門探討“云端AI高性能計算計算能力及計算環境研究”,在會上她提出,現階段HPC與AI融合問題的關鍵在于,在HPC體系結構發生改變的過渡階段,如何在AI的演進階段支撐其計算能力需求,“這是目前HPC應該考慮的問題”。
“加大對大數據與人工智能等新興超算應用的支撐,也是中國超算未來的目標之一。”在ISC19的焦點論壇“E級計算機面臨的挑戰與愿景”上,國家重點研發計劃“高性能計算重點專項”總體專家組組長、中山大學數據科學與計算機學院院長錢德沛表示。他認為,目前來看,AI與HPC之間的聯系還處于一個“初級狀態”。
“AI有大量的數據、訓練任務需要超級計算的支持,同時HPC也可以把AI應用到新的領域,比如利用人工智能更精準地完成天氣預報等。但從長遠來看,AI與HPC可能還存在更深層的關系,轉變人工智能的初衷就是從人的智能向計算轉變的一個啟發,它對未來的計算模式可能會帶來非常重要的影響。”錢德沛表示。
擁有“支撐AI的能力”成趨勢
HPC與AI的深度融合,已經是大勢所趨。自2018年6月以來,新上榜TOP500的超級計算機,前十名都聲稱有支持AI的能力。“從這里能夠看出,對于云端AI的支撐能力,已經是HPC界比較關注的一點。”陳左寧表示。
目前排名TOP500第一位的Summit超級計算機,就是“非常典型支撐AI”的HPC。“其胖節點的設計使其單節點存儲容量相當大,GPU的訪存也非常可觀,綜合下來一個胖節點的計算能力相當強,基本可滿足大多AI‘一個模型放在里邊做’的需求了。”陳左寧解釋說。
據了解,Summit支撐AI的能力已經達到3.3E,高性能的胖節點設計使系統總節點數減少,從而降低了應用擴展難度,大容量的多級高效存儲及其間的硬件一致性支持,加之高速好用的本地存儲等的綜合作用下,使其局部的計算能力非常強,非常適合深度神經網絡(DNN)這類AI應用的提升。另外,來自中科院、清華大學等單位的超算團隊在“神威·太湖之光”上也運行了許多AI應用,并在其上提供完整的AI軟件。
中科曙光高性能計算產品事業部首席科學家吉青在接受《中國科學報》關于類似問題的采訪時說,AI與HPC將會相互促進、共同生長。她認為,AI是信息化發展到一定階段的必然。AI伴隨著海量數據,大數據處理往往通過AI實現。“人工智能本質之一是大數據的一種處理技術,它的出現也在改變傳統的高性能計算。”
“比如架構的改變,其實是計算核心的改變。從原來的純CPU變成CPU+GPU,就是隨著應用需求的改變而衍生的架構改變。”吉青說,曙光目前還在探索CPU+GPU+AI芯片的架構革新,比如支持寒武紀AI芯片卡組等比較流行的AI芯片,以匹配廣泛的AI+行業應用。
在勞倫斯伯克利國家實驗室超算科學家、超算TOP500榜單聯合創始人埃里奇·斯特羅邁爾看來,HPC并不天然適合AI計算,但傳統的HPC架構,有必要隨著AI計算的需要,調優和改變。
“改變的發生,可能會影響未來TOP500的測評規則——事實上,我們也正在考慮測評手段的與時俱進。”埃里奇·斯特羅邁爾表示。
陳左寧也表示,目前HPC對AI計算支持的評價,光靠Linpack測試是不夠的,還要看能效、性價比等指標。
仍待進一步探究
不過,回顧國內外較為關注的E級計算機,E級計算機對云端AI、對與訓練有關的計算能力的支撐,到底要不要做,做到什么程度,目前還沒有結論。
“從我國發布的將要建設的E級計算機的要求來看,并沒有專門對AI計算支撐的標準或要求。國內研制E級計算的3家單位,現在對云端AI計算的支持還在探索。”陳左寧表示。
不過陳左寧表示,AI對計算能力的需求潛力已毋庸置疑。但由于AI發展的歷史尚短,自身無論計算理論、方法算法都尚不完整,特別是數學理論的基礎還很不堅實,因此,還不能如傳統的數值模擬一樣,能夠非常明確地提出對HPC計算能力的要求。
“也就是說,AI的計算理論還沒有發展到它能對HPC明確提出很高的需求階段。但反過來看,如果AI能夠達到人的智能水平,肯定會對計算能力、存儲能力等的需求非常高。”陳左寧說,還應注意到,深度學習僅僅是AI算法的一個分支,面向AI的云端高性能計算環境需要廣泛適應包括深度學習在內的多種應用模式,未來的應用需求仍有待進一步研究。
摘自《中國科學報》