12月8日,國家超級計算天津中心和國防科技大學,聯(lián)合數(shù)十家合作團隊,共同發(fā)布“面向新一代國產E級超級計算系統(tǒng)的十大應用挑戰(zhàn)”,支撐解決世界科技前沿、經濟主戰(zhàn)場、國家重大需求、人民生命健康領域的重大挑戰(zhàn)性問題。
據(jù)介紹,新一代百億億次(E級)高性能計算機的研發(fā),是國家在新一代信息技術領域的重要部署,將有力驅動國家信息技術產業(yè)創(chuàng)新發(fā)展,其自主化程度遠高于其他超算平臺,同時規(guī)模與性能更是大幅提升。此次十大應用挑戰(zhàn)的發(fā)布,其目的就是為了充分發(fā)揮新一代E級高性能計算機強大計算能力,研發(fā)適配國產超級計算系統(tǒng)的關鍵技術和應用軟件,構建新的國產E級超級計算應用生態(tài)。
挑戰(zhàn)一:磁約束聚變堆全裝置聚變模擬(人造小太陽)
可控聚變能源被認為是人類未來應對能源和環(huán)境挑戰(zhàn)最有效的手段之一,而在磁約束聚變裝置設計中,最重要的問題就是如何用更低的成本約束住更高密度、溫度的等離子體。
目前被廣泛認可的一個主要限制約束性能的機制是邊界和芯部產生的所謂微觀不穩(wěn)定性。在先前的研究中由于多時間尺度的問題,這些不穩(wěn)定性通常采用回旋動理學或磁流體力學等簡化模型來描述,并且等離子體芯部和邊界需要分別建模。
在新一代國產E級計算機上,將可以直接采用電磁全動理學這一經典等離子體最基本的模型來直接模擬可分辨離子回旋半徑的磁約束聚變堆全裝置等離子體,并且不用區(qū)分邊界與芯部。借助幾何算法,使系統(tǒng)長期演化模擬結果的可靠性可以得到保證,更準確而自洽地再現(xiàn)其內部所發(fā)生的不穩(wěn)定性過程,尋求提升磁約束聚變裝置約束性能的機制。
此外,全裝置等離子體動理學模擬還能得到對裝置尺度的等離子體演化更加保真的模型,更好地指導未來磁約束聚變堆等離子體的設計,將為可控聚變研究和聚變能源開發(fā)提供強力支撐。
挑戰(zhàn)二:全尺寸航空航天飛行器超百億網格計算流體力學模擬
近年來的臨近空間飛行器復雜流動問題數(shù)值研究對認識高空高速下的流動機理起到了重要作用。臨近空間飛行器飛行包絡覆蓋連續(xù)流域、滑移流域和過渡流域,存在復雜的氣動力熱、稀薄非平衡效應、大動壓下的多體分離、化學反應、等離子體等跨流域非定常多場耦合現(xiàn)象。
上一代超級計算機在計算能力和架構設計上無法進行滿足精度和效率要求的臨近空間飛行器跨流域非定常多場耦合模擬,而新一代國產E級超級計算機在理論上有望突破計算瓶頸,從而實現(xiàn)超百億網格高精度全尺寸這一模擬。
臨近空間飛行器跨流域非定常多場耦合模擬研究一方面可以幫助我們全面認識飛行器在高空高速飛行狀態(tài)下的復雜耦合流動現(xiàn)象,并辨識流動機制及其對飛行器的影響,另一方面可以拓展新一代超級計算機上的數(shù)值風洞構建能力,為航天各類運載飛行器和航空國產大飛機等設計提供載體,使其更好地服務于我國戰(zhàn)略發(fā)展和建設。
挑戰(zhàn)三:數(shù)字細胞超億級原子體系動力學模擬
在解讀生命奧秘特別是細胞生物機理方面,全原子分子動力學模擬的虛擬實驗作用日益凸顯。
細胞內充斥了各種各樣的生物大分子和小分子,始終處于一種動態(tài)的擁擠環(huán)境中,而擁擠環(huán)境對生物分子的擴散、聚集、構象變化和化學反應都會有顯著影響。因此,在細胞尺度上對生物體系進行全原子分子動力學模擬將是認知生命過程的重要手段,但是目前的計算機很難提供足夠的算力來實現(xiàn)。
國產新一代的E級超級計算機理論上可以實現(xiàn)超億級甚至十億級原子數(shù)字細胞的分子動力學模擬,使得未來細胞水平上的精準模擬成為可能。對細胞進行全原子分子動力學模擬,將使我們可以在虛擬實驗中對整個細胞及其內外的生物大分子的微觀動態(tài)過程進行高時空分辨的觀察,幫助我們全面深刻地去認識新冠病毒等如何侵入細胞、細胞如何進行物質信息交換等生命科學重大挑戰(zhàn)性問題。
通過數(shù)字模擬獲得的知識,也將對未來的新藥研發(fā)、生命健康保障起到奠基性的作用。
挑戰(zhàn)四:對流尺度次公里級精細化數(shù)值天氣預報
對于尺度較小、發(fā)展劇烈的強對流天氣系統(tǒng),往往難以預報,且容易造成破壞性災害,對于大城市的運行管理帶來很大的威脅。
隨著天氣系統(tǒng)時空尺度的縮小,大氣的混沌屬性越發(fā)明顯,預報的不確定性加劇,這為精細化天氣預報帶來了很大的挑戰(zhàn),目前基于探測技術的預警時效性和對系統(tǒng)演變的預測往往不足。
基于新一代國產E級超級計算機的強大計算能力,綜合超高分辨率模擬、集合預報、快速循環(huán)等技術,提前0-6小時預報強對流天氣的觸發(fā)、演變、消亡,為單個對流系統(tǒng)提供連續(xù)、概率性的預測,改進強對流引發(fā)的局地強降水、冰雹、突發(fā)大風、龍卷的時空落區(qū)預報準確性。
挑戰(zhàn)五:百億級高效高通量虛擬藥物篩選
先導結構的發(fā)現(xiàn)和優(yōu)化作為新藥發(fā)現(xiàn)階段的研究核心,往往需要花費數(shù)年時間以及高達數(shù)億美元的資金,是藥物研發(fā)的關鍵技術瓶頸。因此如何生成新分子及優(yōu)化分子的關鍵屬性(如生物活性、成藥性、安全性和選擇性等)是影響藥物分子設計成敗的兩個關鍵問題。
據(jù)估計,目前可利用的化學空間大小范圍約為10^23至10^60,即便是某些成熟數(shù)據(jù)庫的小分子數(shù)量也達到十億級別。如何在如此巨大的化學空間內如何進行分子的智能生成、結構的快速演化搜索和性質預測是藥物篩選所面臨的巨大挑戰(zhàn)。
目前,藥物篩選通常可以利用分子對接等相對粗略的方法,在之前的超級計算機上已經可以實現(xiàn)對十億級別的小分子進行快速的初篩,再利用更為精確的自由能擾動計算等方法進行更為準確的評價分析。
新一代E級超級計算機提供的強大算力能夠支撐百億級別藥物小分子的快速篩選,輔以更先進的算法,可以實現(xiàn)虛擬藥物篩選效能幾十乃至上百倍的提升;同時高效的藥物篩選,還可以與中藥有效組分發(fā)現(xiàn)結合,推動中藥研發(fā)的現(xiàn)代化。
挑戰(zhàn)六:面向通用人工智能的超大規(guī)模預訓練模型
深度神經網絡是新一代人工智能的領航區(qū),并且已經成功應用于計算機視覺和自然語言處理等領域,取得了突出成效。
隨著應用場景的豐富和發(fā)展,傳統(tǒng)基于有標注數(shù)據(jù)集的領域模型訓練和應用范式越來越無法適用人工智能應用的開發(fā)和普及。基于無標注數(shù)據(jù)的自監(jiān)督學習技術和綜合能力好、通用能力強的大規(guī)模預訓練模型的出現(xiàn),將數(shù)據(jù)驅動的深度學習技術和通用人工智能推向新的發(fā)展階段。
近年來,計算機和人工智能領域的專家和企業(yè)已經在利用現(xiàn)有高性能計算機上完成了 1.75 萬億參數(shù)的多模態(tài)預訓練模型開發(fā),而國產新一代 E 級超級計算機使得支撐參數(shù)規(guī)模更大、通用性更強的模型(十萬億甚至百萬億以上)的訓練和應用成為可能。
大規(guī)模預訓練模型的研發(fā)部署,一方面,將推動類人機器人加快落地;另一方面,有通用模型做基礎,將大幅降低細分領域數(shù)據(jù)向智能化模型轉化的難度,有效推動人工智能應用基礎設施的構建,提升工業(yè)現(xiàn)代化、數(shù)字經濟發(fā)展、智能社會數(shù)字化治理能力。
挑戰(zhàn)七:FAST超大規(guī)模觀測數(shù)據(jù)的高分辨率巡天圖像處理
中性氫巡天是 “中國天眼”(FAST射電望遠鏡)的重要科學目標之一,通過探測可觀測宇宙范圍內中性氫的分布情況,為宇宙起源與演化、暗物質與暗能量等前沿科學領域的研究提供支撐。
受視場所限,望遠鏡每次觀測只能覆蓋有限天區(qū),中性氫巡天觀測持續(xù)時間可達數(shù)年,所積累的觀測數(shù)據(jù)需拼接融合才能獲得完整的高分辨率巡天圖像。在中性氫巡天數(shù)據(jù)處理流程中,網格化(Gridding)是計算量最大且I/O最為密集的環(huán)節(jié),是制約中性氫巡天數(shù)據(jù)處理與成果產出效率的瓶頸。
新一代E級超級計算機的數(shù)據(jù)處理能力配合高性能網格化算法,能夠應對PB量級的中性氫巡天觀測數(shù)據(jù),從而為國之重器“中國天眼”能夠“早出成果、多出成果,出大成果、出好成果”提供強大助力,促生天文學基礎與前沿領域的重大發(fā)現(xiàn)。
挑戰(zhàn)八:全球尺度地震全波形反演
地震全波形反演是當前分辨率最高的成像方法,是研究地球內部結構和動力學演化過程的強有力工具,還可為礦產資源和油氣勘查提供關鍵支撐。
在過去十年里,地震科學領域專家已經在上一代超級計算機上實現(xiàn)了區(qū)域尺度的低頻帶彈性波全波形反演研究。
國產新一代的E級超級計算機將可以實現(xiàn)全球尺度的、包括地震波衰減特征在內的高頻帶粘彈性地震波場傳播模擬和波形成像研究。全球尺度高頻帶粘彈性地震波形反演一方面可以獲得地球內部高精度成像結果,加深我們對板塊構造、俯沖帶和造山帶形成和演化的認識,另一方面可以提供地球內部各圈層(中下地殼、巖石圈、軟流圈等)物質和能量交換的地震學證據(jù),為研究地球深部成礦作用和火山/地震活動提供依據(jù),幫助人類更全面的認知地質演化,理解類地行星的形成發(fā)展。
挑戰(zhàn)九:全腦千億神經元動力學仿真
近年來的神經科學研究獲取了大量的大腦結構和活動的數(shù)據(jù),以此來理解大腦的工作機制。對于大腦的高級功能,如運動控制和思考等功能的解析和再現(xiàn),迫切需要建立起人類全腦規(guī)模的仿真神經網絡平臺。
人類的大腦有860億神經元,在過去的十年里,計算神經科學領域的專家在上一代的超級計算機上已經進行了人腦百分之一大小規(guī)模的腦回路仿真。而新一代的E級超級計算機在理論可以實現(xiàn)包括大腦皮層、小腦和基底神經節(jié)在內的全腦神經回路的模擬。
人類全腦回路的仿真和研究,一方面在可以幫助我們理解大腦的思考等高級功能,開發(fā)類腦人工智能算法。另一方面,帕金森癥,亨廷頓舞蹈癥等大腦疾病的發(fā)病機理也將能夠得到進一步的分析和驗證。此外,使用仿真腦模型構建基于脈沖神經網絡的神經模態(tài)機器人,能夠提升現(xiàn)有機器人系統(tǒng)的感知與決策水平。
挑戰(zhàn)十:完全分辨率的全球次中尺度海洋數(shù)值模擬
氣候變化是全球可持續(xù)發(fā)展所面臨的重大挑戰(zhàn),也是科學界面臨的最具挑戰(zhàn)性的科學問題之一,海洋則是控制氣候系統(tǒng)季節(jié)內、季節(jié)、年際、年代際變率的重要分量。
近年來,隨著海洋觀測的飛速發(fā)展,海洋中尺度、次中尺度過程的許多機理被不斷揭示,海洋多尺度相互作用的特征更加清晰,對海洋環(huán)流數(shù)值模擬也提出了更高的要求,分辨率中尺度、次中尺度過程及其與大氣的相互作用成為重要的研究方向。
在過去的10年期間,全球的科學家在此方向作出了不懈努力,將全球的海洋模擬提高到部分分辨率次中尺度渦(2km)的分辨率,而我國的科學家也自主開發(fā)了全球3-5km的海洋模式,基本可以完全分辨開闊大洋的中尺度過程。新一代的E級超級計算機可以實現(xiàn)完全分辨率次中尺度過程的模擬,幫助科學家全面理解海洋內部多尺度相互作用過程,以及海洋能量串級過程,并進一步提高對海洋環(huán)流以及整個氣候系統(tǒng)的模擬能力。
來源:科技日報