色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專(zhuān)欄

          EEPW首頁(yè) > 博客 > 1.5 Exaflops!中國(guó)新一代超算細(xì)節(jié)曝光!

          1.5 Exaflops!中國(guó)新一代超算細(xì)節(jié)曝光!

          發(fā)布人:芯智訊 時(shí)間:2023-09-16 來(lái)源:工程師 發(fā)布文章

          image.png

          9月16日消息,據(jù)外媒The next platform報(bào)道,美國(guó)計(jì)算機(jī)協(xié)會(huì)(Associationfor Computing Machinery; ACM)近期公布了戈登·貝爾獎(jiǎng)(被譽(yù)為“超級(jí)計(jì)算應(yīng)用領(lǐng)域的諾貝爾獎(jiǎng)”)的入圍名單,基于中國(guó)1.5 EXAFLOPS(百億億次)超級(jí)計(jì)算機(jī)的一篇研究論文再次入圍,該獎(jiǎng)項(xiàng)將在今年11月在美國(guó)丹佛舉行的SC23超級(jí)計(jì)算大會(huì)上頒發(fā)。

          中國(guó)超級(jí)計(jì)算機(jī)再度入圍

          ACM表示,雖然最終的系統(tǒng)規(guī)模以及模擬和模型運(yùn)行的結(jié)果尚未完成,但基于新一代的 1.5 exaflops中國(guó)神威超級(jí)計(jì)算機(jī)(oceanlite,太湖之光升級(jí)版)完成的一篇題為《渦輪機(jī)械流動(dòng)的精確計(jì)算》論文(將在11月SC23會(huì)議之前正式發(fā)布)已經(jīng)入圍。

          早在2021年11月,中國(guó)的超級(jí)計(jì)算機(jī)就曾以4190萬(wàn)個(gè)核心的量子模擬而獲得了戈登貝爾獎(jiǎng)。當(dāng)時(shí)阿里巴巴集團(tuán)、清華大學(xué)、DAMO學(xué)院,浙江實(shí)驗(yàn)室和北京人工智能研究院在Oceanlite機(jī)器中運(yùn)行了一個(gè)名為“八卦路”的預(yù)訓(xùn)練機(jī)器學(xué)習(xí)模型,該模型涉及3700多萬(wàn)個(gè)核心和14.5萬(wàn)億個(gè)參數(shù)。

          此次《渦輪機(jī)械流動(dòng)的精確計(jì)算》論文,則是由Weiqi Shen, Jiahuan Cui, Yao Zheng等(共 19 位作者),來(lái)自浙江大學(xué)、清華大學(xué)、國(guó)家超級(jí)計(jì)算無(wú)錫中心、劍橋大學(xué)、佛羅里達(dá)大學(xué)團(tuán)隊(duì)共同完成。該團(tuán)隊(duì)開(kāi)發(fā)了一種新的大渦流模擬代碼,用于解決渦輪機(jī)械中的可壓縮流。他們將該代碼應(yīng)用于美國(guó)國(guó)家航空航天局(NASA)的重大挑戰(zhàn)問(wèn)題,使用高階非結(jié)構(gòu)化求解器求解高壓渦輪級(jí)聯(lián)的 16.9 億個(gè)網(wǎng)格元素和 8650 億個(gè)自由度。

          根據(jù)該論文的作者顯示,Oceanlite系統(tǒng)擁有超過(guò)100000個(gè)由中國(guó)國(guó)家并行計(jì)算機(jī)工程與技術(shù)研究中心(NRCPC)設(shè)計(jì)的定制SW26010 Pro處理器。

          據(jù)2022年4月中國(guó)科學(xué)技術(shù)大學(xué)、國(guó)家海洋科學(xué)與技術(shù)試點(diǎn)實(shí)驗(yàn)室(青島)、北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院、無(wú)錫國(guó)家超級(jí)計(jì)算中心和中國(guó)海洋大學(xué)組成的聯(lián)合團(tuán)隊(duì),公布了一篇超級(jí)計(jì)算機(jī)模擬復(fù)雜量子多體的文章介紹,SW26010 pro是sw26010改進(jìn)型,擁有6個(gè)核心模塊,每個(gè)模塊有1個(gè)管理Linux線(xiàn)程的核心(MPE)和64個(gè)計(jì)算核心。而組成太湖之光的SW26010處理器,只有4個(gè)核心模塊,說(shuō)明SW26010 pro單片應(yīng)該有50%的性能提升。

          image.png

          The next platform的報(bào)道稱(chēng),SW26010 Pro處理器的64個(gè)(8×8)計(jì)算核心網(wǎng)絡(luò)是一個(gè)具有256KB L2高速緩存的計(jì)算處理單元(CPE)。每個(gè)CPE有四個(gè)邏輯塊,可以在一對(duì)上支持FP64和FP32,在另一對(duì)上則可以支持FP16和BF16。

          SW26010 Pro中的每個(gè)核心模塊上都有一個(gè)DDR4內(nèi)存控制器和16 GB內(nèi)存,內(nèi)存帶寬為51.4 GB/秒,因此整個(gè)處理器有96 GB主內(nèi)存和307.2 GB/s帶寬。六個(gè)CPE通過(guò)環(huán)形互連連接,并有兩個(gè)網(wǎng)絡(luò)接口,使用專(zhuān)有互連將它們連接到外部。SW26010 Pro芯片的FP64或FP32精度為14.03 PB,BF16或FP16精度為55.3 PB。

          The next platform稱(chēng),Oceanlite最大的配置有107520個(gè)節(jié)點(diǎn),共有4193萬(wàn)個(gè)核心,分布在105個(gè)機(jī)柜中。剛剛曝光的論文也證實(shí)了該超級(jí)計(jì)算機(jī)的理論峰值性能為1.5 exaflops,MPE內(nèi)核運(yùn)行在2.1 GHz,CPW內(nèi)核運(yùn)行在2.25 GHz。

          如果將該超級(jí)計(jì)算機(jī)規(guī)模擴(kuò)大到120個(gè)機(jī)柜,在FP64 pervision下的峰值將達(dá)到1.72 Exaflops,這將超過(guò)美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的1.68 Exaflops的“Frontier”超級(jí)計(jì)算機(jī)。在160個(gè)機(jī)柜的條件下,在FP64的峰值性能將接近2.3 Exaflops,將有望擊敗已經(jīng)安裝完成的美國(guó)能源部阿貢國(guó)家實(shí)驗(yàn)室的基于英特爾CPU及GPU的新一代超級(jí)計(jì)算機(jī)“Aurora”,以及正在建設(shè)的美國(guó)勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室基于A(yíng)MD MI300芯片的“El Capitan”超級(jí)計(jì)算機(jī),后兩者的FP64性能都將達(dá)到 2 Exaflops以上。

          不過(guò),最新的戈登·貝爾獎(jiǎng)參賽論文《渦輪機(jī)械流動(dòng)的精確計(jì)算》顯示,其對(duì)于噴氣發(fā)動(dòng)機(jī)模擬在大約58333個(gè)節(jié)點(diǎn)上運(yùn)行,這些節(jié)點(diǎn)代表了超過(guò)350000個(gè)MPE核心和超過(guò)2240萬(wàn)個(gè)CPE核心。這是以上預(yù)測(cè)的Oceanlite最大配置的一半多一點(diǎn)。

          其他入圍者介紹

          1、量子精度的大規(guī)模材料建模:金屬合金中的準(zhǔn)晶體和相互作用擴(kuò)展缺陷的 Ab Initio 模擬

          Sambit Das、Bikash Kanungo、Vishal Subramanian 等人(共八位作者),組成的團(tuán)隊(duì)成員包括密歇根大學(xué)、印度科學(xué)研究所和美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室

          密歇根大學(xué)和印度科學(xué)研究所的團(tuán)隊(duì)與美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室合作,開(kāi)發(fā)了一種混合機(jī)器學(xué)習(xí)和HPC模擬方法,將密度函數(shù)理論(DFT)和量子多體(QMB)問(wèn)題結(jié)合起來(lái),進(jìn)行量子粒子模擬。這項(xiàng)工作實(shí)現(xiàn)了高精度計(jì)算,并通過(guò)將 QMB 方法與 DFT 相結(jié)合的逆-DFT 實(shí)現(xiàn)了大規(guī)模建模。他們實(shí)現(xiàn)了地面階段的能量計(jì)算,同時(shí)保持了與 QMB 相稱(chēng)的精度,最終的軟件能夠利用到Frontier超級(jí)計(jì)算機(jī)系統(tǒng)的60%計(jì)算資源。但不要認(rèn)為這意味著這個(gè)量子模擬可以持續(xù)以 1 EB的速度運(yùn)行。當(dāng)涉及到這個(gè)特定的應(yīng)用程序時(shí),它可能會(huì)更像650 PB的浮點(diǎn)運(yùn)算,而且可能會(huì)少得多,這取決于Frontier的計(jì)算和網(wǎng)絡(luò)效率。

          2、用于先進(jìn)設(shè)計(jì)的百億億次級(jí)多物理場(chǎng)核反應(yīng)堆模擬

          Elia Merzaria、Steven Hamilton、Thomas Evans 等人(共 12 位作者)由來(lái)自美國(guó)賓夕法尼亞州立大學(xué)、橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室、阿貢國(guó)家實(shí)驗(yàn)室和伊利諾伊大學(xué)厄巴納香檳分校的團(tuán)隊(duì)組成

          該研究團(tuán)隊(duì)模擬了一個(gè)先進(jìn)的核反應(yīng)堆系統(tǒng),將輻射傳輸與熱和流體模擬耦合在一起,包括高保真、高分辨率蒙特卡羅代碼 Shift 和計(jì)算流體動(dòng)力學(xué)代碼 NekRS。Nek5000/RS在ORNL的Frontier系統(tǒng)上實(shí)現(xiàn),實(shí)現(xiàn)了10億個(gè)譜元和3500億個(gè)自由度,而Shift則在8192個(gè)系統(tǒng)節(jié)點(diǎn)上實(shí)現(xiàn)了非常高的弱縮放。結(jié)果,他們計(jì)算了 214,896 個(gè)燃料棒區(qū)域中的 6 個(gè)反應(yīng),統(tǒng)計(jì)誤差低于 1%,為蒙特卡羅運(yùn)輸應(yīng)用提供了首個(gè)解決方案。

          ACM報(bào)告稱(chēng),該研究是在Frontier系統(tǒng)的8192個(gè)節(jié)點(diǎn)上運(yùn)行(該超算總的有9402個(gè)節(jié)點(diǎn)),每個(gè)節(jié)點(diǎn)有一個(gè)“Trento”自定義AMD Epyc CPU,每個(gè)節(jié)點(diǎn)擁有四個(gè)“Aldebaran”Instinct MI250X GPU加速器,總計(jì)37608個(gè)GPU。

          3、通過(guò)前所未有的譜元模擬探索湍流瑞利-貝納德對(duì)流的最終狀態(tài)

          Niclas Jansson、Martin Karp、Adalberto Perez 等人(總共 12 位作者),其中包括來(lái)自 KTH 皇家理工學(xué)院、弗里德里?!啔v山大大學(xué)、馬克斯·普朗克計(jì)算和數(shù)據(jù)設(shè)施以及伊爾梅瑙工業(yè)大學(xué)的團(tuán)隊(duì)

          該團(tuán)隊(duì)開(kāi)發(fā)了高保真光譜元素代碼 Neko,這對(duì)于對(duì)完全發(fā)展的湍流進(jìn)行前所未有的大規(guī)模直接數(shù)值模擬至關(guān)重要,同時(shí)保持 GPU 加速平臺(tái)上的高性能可移植性。他們應(yīng)用了 GPU 優(yōu)化的預(yù)處理器,其任務(wù)重疊用于壓力泊松方程和原位數(shù)據(jù)壓縮。他們還通過(guò)復(fù)雜的工作流程控制,在配備多達(dá) 16,384 個(gè)GPU的 芬蘭的“LUMI”超級(jí)計(jì)算機(jī)和意大利的“Leonardo”超級(jí)計(jì)算機(jī)上進(jìn)行了大規(guī)模瑞利-貝納德對(duì)流的初始運(yùn)行。

          4、在 Cerebras CS-2 系統(tǒng)上使用代數(shù)壓縮擴(kuò)展多維地震處理的“記憶墻”

          Hatem Ltaief、Yuxi Hong、Leighton Wilson 等人(總共六位作者)是阿卜杜拉國(guó)王科技大學(xué)和 Cerebras Systems Inc. 團(tuán)隊(duì)

          研究人員利用針對(duì)人工智能 (AI) 定制的目前為止這是世界上最大的AI芯片Cerebras CS-2 系統(tǒng)的高內(nèi)存帶寬進(jìn)行地震數(shù)據(jù)處理,通過(guò)利用低秩矩陣近似來(lái)擬合 SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)晶圓級(jí)硬件上的問(wèn)題,以及使用許多依賴(lài)于多維卷積算子的基于波動(dòng)方程的算法。因此,該團(tuán)隊(duì)將標(biāo)準(zhǔn)地震基準(zhǔn)數(shù)據(jù)集實(shí)施到 Cerebras 處理元件的小型本地存儲(chǔ)器中,將最壞情況下的負(fù)載平衡整個(gè)應(yīng)用程序執(zhí)行推斷到 35,784,000 個(gè)處理元件上的 48 個(gè) CS-2 系統(tǒng)。這是在人工智能定制架構(gòu)上運(yùn)行的應(yīng)用程序的一個(gè)重要示例,可以支持新一代地震算法。

          5、將深度等變模型的領(lǐng)先精度擴(kuò)展到真實(shí)尺寸的生物分子模擬

          哈佛大學(xué)約翰·A·保爾森工程與應(yīng)用科學(xué)學(xué)院團(tuán)隊(duì)成員 Albert Musaelian、Anders Johansson、Simon Batzner 和 Boris Kozinsky

          該研究團(tuán)隊(duì)開(kāi)發(fā)了 Allegro 架構(gòu),以彌合原子模擬的精度與速度之間的權(quán)衡,并能夠以量子保真度描述前所未有的復(fù)雜結(jié)構(gòu)中的動(dòng)力學(xué)。這是通過(guò)創(chuàng)新模型架構(gòu)、大規(guī)模并行化和針對(duì)高效 GPU 使用而優(yōu)化的模型實(shí)現(xiàn)相結(jié)合來(lái)實(shí)現(xiàn)的。Allegro 的可擴(kuò)展性通過(guò)在美國(guó)勞倫斯伯克利國(guó)家能源研究科學(xué)計(jì)算中心的 “Perlmutter” 系統(tǒng)上對(duì)蛋白質(zhì)動(dòng)力學(xué)進(jìn)行長(zhǎng)達(dá)納秒的穩(wěn)定模擬,模擬了HIV病毒衣殼的原子結(jié)構(gòu),高達(dá)4400萬(wàn)個(gè)原子結(jié)構(gòu),模擬時(shí)間為幾納秒。他們實(shí)現(xiàn)了高達(dá) 1 億個(gè)原子的強(qiáng)大擴(kuò)展。

          首個(gè)戈登·貝爾氣候建模獎(jiǎng)

          值得一提的是,ACM還將頒發(fā)其首個(gè)戈登·貝爾氣候建模獎(jiǎng)。

          由美國(guó)桑迪亞國(guó)家實(shí)驗(yàn)室開(kāi)發(fā)和擴(kuò)展的能源Exascale地球系統(tǒng)模型的SCREAM變體入圍了該獎(jiǎng)項(xiàng)。有趣的是,SCREAM的部分代碼是從頭開(kāi)始的,使用C 和Kokkos庫(kù)將代碼打包到系統(tǒng)中的CPU和GPU,在這種情況下,它在美國(guó)橡樹(shù)嶺實(shí)驗(yàn)室的“Frontier”超級(jí)計(jì)算機(jī)上運(yùn)行,每天模擬1.26年進(jìn)行實(shí)際的云解析模擬。

          中國(guó)Oceanlite系統(tǒng)也入圍了該決賽,這一系統(tǒng)模擬了2021年末和2022年初湯加近海水下火山噴發(fā)的影響,包括沖擊波、地震、海嘯以及水和火山灰的擴(kuò)散。模擬和模型的結(jié)合能夠模擬400億粒子,并以80%的計(jì)算效率在Oceanlite系統(tǒng)中運(yùn)行3900萬(wàn)個(gè)核心。

          第三位入圍戈登·貝爾氣候建模決賽的是日本的一組研究人員,他們?cè)诶硌袑?shí)驗(yàn)室的“Fugaku”超級(jí)計(jì)算機(jī)中獲得了11580個(gè)節(jié)點(diǎn),約占該機(jī)器總節(jié)點(diǎn)的7%,并為2021年?yáng)|京奧運(yùn)會(huì)制作了一個(gè)1000集合、500米分辨率、30秒刷新的天氣模型。這是一個(gè)真實(shí)的用例,在30天內(nèi)發(fā)布了超過(guò)75248個(gè)天氣預(yù)報(bào),每個(gè)30分鐘的預(yù)報(bào)都在不到三分鐘的時(shí)間內(nèi)完成。

          編輯:芯智訊-浪客劍


          *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



          關(guān)鍵詞: 芯片

          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉