AMD最大的芯片:13個(gè)Chiplet,1460億晶體管
來源:內(nèi)容由半導(dǎo)體行業(yè)觀察(ID:icbank)編譯自tomshardware,謝謝。
AMD在 2023 年國際消費(fèi)電子展上推出了其下一代 Instinct MI300 加速器,我們有幸獲得了一些動手時(shí)間,并拍攝了幾張這款龐大芯片的特寫照片。毫無疑問,Instinct MI300 是一個(gè)改變游戲規(guī)則的設(shè)計(jì)——這個(gè)數(shù)據(jù)中心 APU 混合了總共 13 個(gè)小芯片,其中許多是 3D 堆疊的,以創(chuàng)建一個(gè)具有 24 個(gè) Zen 4 CPU 內(nèi)核并融合了 CDNA 3 圖形的芯片引擎和 8 堆 HBM3??傮w而言,該芯片擁有 1460 億個(gè)晶體管,是 AMD 投入生產(chǎn)的最大芯片。
MI300 擁有 1460 億個(gè)晶體管,輕松超過英特爾的 1000 億個(gè)晶體管Ponte Vecchio,再加上 128GB 的HBM3 內(nèi)存??紤]到其閃亮的外觀,去邊芯片很難拍攝,但您可以清楚地看到中心芯片側(cè)面的八個(gè) HBM3 堆棧。在這些 HBM 堆棧之間放置小的結(jié)構(gòu)硅片,以確保在封裝頂部擰緊冷卻溶液時(shí)的穩(wěn)定性。
該芯片的計(jì)算部分由九個(gè) 5nm 小芯片組成,它們是 CPU 或 GPU 內(nèi)核,但 AMD 沒有詳細(xì)說明每個(gè)小芯片的使用數(shù)量。Zen 4 內(nèi)核通常部署為八核裸片,因此我們可以查看三個(gè) CPU 裸片和六個(gè) GPU 裸片。GPU 芯片使用 AMD 的 CDNA 3 架構(gòu),這是 AMD 數(shù)據(jù)中心專用圖形架構(gòu)的第三次修訂。AMD 沒有指定 CU 數(shù)量。
這九個(gè)裸片被 3D 堆疊在四個(gè) 6nm 基礎(chǔ)裸片之上,這些裸片不僅僅是無源中介層——我們被告知這些裸片是有源的,可以處理 I/O 和各種其他功能。AMD 向我們展示了另一個(gè) MI300 樣品,該樣品的頂部裸片用砂帶打磨機(jī)打磨掉,以揭示四個(gè)有源中介層裸片的架構(gòu)。在那里,我們可以清楚地看到不僅可以在 I/O 塊之間實(shí)現(xiàn)通信的結(jié)構(gòu),還可以看到與 HBM3 堆棧接口的內(nèi)存控制器之間的通信。但我們不允許拍攝第二個(gè)樣本。
3D 設(shè)計(jì)允許在 CPU、GPU 和內(nèi)存芯片之間實(shí)現(xiàn)令人難以置信的數(shù)據(jù)吞吐量,同時(shí)還允許 CPU 和 GPU 同時(shí)處理內(nèi)存中的相同數(shù)據(jù)(零拷貝),從而節(jié)省電力、提高性能并簡化編程。看看這個(gè)設(shè)備是否可以在沒有標(biāo)準(zhǔn) DRAM 的情況下使用將會很有趣,正如我們在英特爾的 Xeon Max CPU中看到的那樣,它也采用了封裝 HBM。
AMD 不愿透露細(xì)節(jié),因此不清楚 AMD 是使用標(biāo)準(zhǔn)的 TSV 方法將上下裸片熔合在一起,還是使用更先進(jìn)的混合鍵合方法。我們被告知 AMD 將很快分享有關(guān)封裝的更多細(xì)節(jié)。
AMD 聲稱 MI300 提供的 AI 性能是 Instinct MI250 的八倍,每瓦性能是Instinct MI250的五倍(使用具有稀疏性的 FP8 測量)。AMD 還表示,它可以將 ChatGPT 和 DALL-E 等超大型 AI 模型的訓(xùn)練時(shí)間從幾個(gè)月縮短到幾周,從而節(jié)省數(shù)百萬美元的電費(fèi)。
當(dāng)前一代的 Instinct MI250 為 Frontier 超級計(jì)算機(jī)提供動力,這是世界上第一臺百億億級計(jì)算機(jī),而 Instinct MI300 將為即將推出的兩臺 exaflop El Capitan 超級計(jì)算機(jī)提供動力。AMD 告訴我們,這些 halo MI300 芯片價(jià)格昂貴且相對稀有——它們不是大批量產(chǎn)品,因此它們不會像EPYC Genoa 數(shù)據(jù)中心 CPU那樣得到廣泛部署。但是,該技術(shù)將過濾到不同外形的多種變體。
該芯片還將與Nvidia 的 Grace Hopper Superchip競爭,后者在同一塊板上結(jié)合了 Hopper GPU 和 Grace CPU。這些芯片預(yù)計(jì)將于今年上市。基于 Neoverse 的 Grace CPU 支持 Arm v9 指令集,并且系統(tǒng)配備了兩個(gè)與 Nvidia 新品牌 NVLink-C2C 互連技術(shù)融合在一起的芯片。AMD 的方法旨在提供卓越的吞吐量和能效,因?yàn)閷⑦@些設(shè)備組合到一個(gè)封裝中通常比連接到兩個(gè)單獨(dú)的設(shè)備時(shí)能夠在單元之間實(shí)現(xiàn)更高的吞吐量。
MI300 還將與 Intel 的Falcon Shores競爭,該芯片將具有數(shù)量不等的計(jì)算塊,具有 x86 內(nèi)核、GPU 內(nèi)核和內(nèi)存,具有令人眼花繚亂的可能配置,但這些配置要到 2024 年才會到貨。
在這里,我們可以看到 MI300 封裝的底部以及用于 LGA 安裝系統(tǒng)的接觸墊。AMD 沒有分享有關(guān)插槽機(jī)制的詳細(xì)信息,但我們一定會盡快了解更多信息——該芯片目前在 AMD 的實(shí)驗(yàn)室中,該公司預(yù)計(jì)將在 2023 年下半年交付 Instinct MI300。El Capitan超級計(jì)算機(jī)將在 2023 年部署時(shí)成為世界上最快的超級計(jì)算機(jī)。目前正在按計(jì)劃進(jìn)行。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。
fpga相關(guān)文章:fpga是什么