色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專欄

          EEPW首頁(yè) > 博客 > AMD Zen4 EPYC架構(gòu)揭秘:奇妙的96核心、12通道DDR5!

          AMD Zen4 EPYC架構(gòu)揭秘:奇妙的96核心、12通道DDR5!

          發(fā)布人:芯智訊 時(shí)間:2022-11-16 來(lái)源:工程師 發(fā)布文章

          近日,AMD正式發(fā)布了代號(hào)“Genoa”(熱那亞)的第四代霄龍EPYC 9004系列處理器,面向服務(wù)器、數(shù)據(jù)中心、高性能計(jì)算、人工智能等領(lǐng)域。

          此前,我們已經(jīng)介紹了EPYC 9004系列的型號(hào)規(guī)格、整體特性、性能能效,但是關(guān)于它,還有很多層次的東西可以挖掘,包括架構(gòu)、SoC、內(nèi)存、小芯片、CXL等等。

          今天,我們就來(lái)仔細(xì)說(shuō)道說(shuō)道。

          圖片

          一、Zen4架構(gòu)

          EPYC 9004系列基于和桌面銳龍7000系列同款的Zen4架構(gòu),只是針對(duì)服務(wù)器與數(shù)據(jù)中心應(yīng)用做了適當(dāng)?shù)恼{(diào)整優(yōu)化。

          圖片

          整體而言,綜合計(jì)算33種不同的服務(wù)器負(fù)載,Zen4架構(gòu)的IPC相比Zen3提升了大約14%,這比銳龍7000系列的提升高了1個(gè)百分點(diǎn)。

          不同模塊的貢獻(xiàn)差不多,最大的還是前端部分,接下來(lái)是載入/存儲(chǔ)、分支預(yù)測(cè)、執(zhí)行引擎、二級(jí)緩存。

          圖片

          圖片

          架構(gòu)總覽,以及與Zen3的變化細(xì)節(jié)對(duì)比,都和桌面版Zen4幾乎毫無(wú)二致。這里也就不再贅述了,感興趣的可以參考我之前的解析。

          圖片

          圖片

          AVX-512指令集其實(shí)也是一模一樣的,但它在服務(wù)器數(shù)據(jù)中心顯然更加如魚(yú)得水,作用更加明顯。

          根據(jù)AMD提供的數(shù)字,雙路96核心新旗艦EPYC 9654對(duì)比雙路64核心老旗艦EPYC 7763,得益于規(guī)格性能的改進(jìn),尤其是AVX-512指令集的加持,NLP吞吐量、物體檢測(cè)吞吐量、圖像識(shí)別吞吐量分別增加了大約4.2倍、3.5倍、3倍之多!

          圖片

          安全方面也更豐富,其中安全加密虛擬化(SEV)方面,除了繼續(xù)支持SME、SEVES、SEV-SNP,還將內(nèi)存加密升級(jí)到AES-256-XTS,并支持1006個(gè)加密客戶機(jī),支持多重主機(jī)密鑰(SMKE)。

          另外強(qiáng)化了對(duì)客戶機(jī)的保護(hù),尤其是可免于SMT攻擊。

          二、SoC總覽

          圖片

          這是EPYC 9004系列額整體布局圖、核心特性。

          這一代依然沒(méi)有獨(dú)立芯片組,而是一個(gè)完整的SoC,延續(xù)chiplet小芯片設(shè)計(jì),內(nèi)部包含一個(gè)IOD、最多12個(gè)CCD。

          CCD每個(gè)集成8顆Zen4 CPU核心、32MB三級(jí)緩存,合計(jì)最多96核心、384MB三級(jí)緩存,同時(shí)也有8個(gè)CCD、4個(gè)CCD的版本,分別最多64核心、32核心。

          IOD內(nèi)集成了DDR5內(nèi)存控制器、PCIe 5.0/CXL 1.1+控制器、第三代Infinity Fabric控制器、安全處理器。

          內(nèi)存為12通道,最高頻率4800MHz。PCIe 5.0可提供128條。這兩部分后邊細(xì)說(shuō)。

          封裝接口改為新的SP5,尺寸增加到約75mm×72mm。

          圖片

          單路配置下,EPYC 9004系列可搭配最多24條DDR5內(nèi)存,每通道2條(2DPC),可提供128條PCIe 5.0、8條PCIe 3.0通道。

          雙路配置下,每個(gè)內(nèi)存通道就只能裝1條了(1DPC),最多還是12條,PCIe 5.0通道對(duì)外可用則是最多160條,每路80條對(duì)外、48條用于彼此互連,另外還有12條PCIe 3.0,每路6條。

          圖片

          IF高速總線升級(jí)到了第三代,最高帶寬32Gbps,可選3條或4條鏈接,前者是默認(rèn)的,此時(shí)對(duì)應(yīng)的系統(tǒng)可用PCIe 5.0通道數(shù)量就是剛才說(shuō)的160條。

          如果選擇4鏈接,每路處理器就要貢獻(xiàn)一半的PCIe 5.0通道用于彼此互連,留給系統(tǒng)可用的就是128條,這和上代是相同的。

          當(dāng)然,即便同樣128條,從PCIe 4.0升級(jí)到PCIe 5.0,可用帶寬也是翻倍的。

          圖片

          160條之多的PCIe 5.0通道能干什么?那就很隨意了。

          xGMI、PCIe、SATA、CXL想怎么玩就怎么玩。x16、x8、x4、x2、x2想怎么拆分就怎么拆分。每一路x16都可以連接最多9個(gè)PCIe設(shè)備(一個(gè)x8和八個(gè)x1)。

          圖片

          I/O性能方面,EPYC 9004支持新的高級(jí)虛擬中斷控制器(AVIC),提升虛擬中斷性能,并改善了中斷處理吞吐量,包括CPU核心內(nèi)部與SoC層面。

          搭配PCIe 4.0 x16規(guī)格的200Gbps(20萬(wàn)兆)網(wǎng)卡,默認(rèn)設(shè)置下效率即可超過(guò)90%,最高達(dá)94%,單向能跑到188Gbps,雙向則能跑到375Gbps。

          如果搭配PCIe 5.0 x16規(guī)格的400Gbps(40萬(wàn)兆) InfiBand高速網(wǎng)絡(luò),標(biāo)準(zhǔn)配置下效率也能超過(guò)90%,最高甚至達(dá)99%,能跑出396Gbps。

          三、內(nèi)存

          圖片

          內(nèi)存方面,一如桌面銳龍7000系列,EPYC 9004也僅支持DDR5,可以帶來(lái)更高的頻率與帶寬、更低的電壓與功耗、更好的電源管理(板載PMIC)、更多的通道與更低的延遲、更大的容量、更好的校驗(yàn)糾錯(cuò)(板載ECC),等等。

          圖片

          EPYC 9004系列支持12個(gè)DDR5內(nèi)存通道,單路最大容量6TB(單條512GB)。

          標(biāo)準(zhǔn)的4800MHz頻率下,峰值理論帶寬可達(dá)460GB/s。

          圖片

          延遲方面,EPYC 9004略有增加,但影響不大,其中SoC約73ns、設(shè)備約45ns,總計(jì)約118ns,比上代分別增加了3ns、10ns。

          圖片

          EPYC 9004還支持每路多重內(nèi)存節(jié)點(diǎn)(NPS),可以對(duì)12條內(nèi)存進(jìn)行分組管理,進(jìn)一步優(yōu)化性能。

          四、小芯片布局

          圖片

          EPYC 9004依然是chiplet小芯片布局,其中CCD最大數(shù)量從上代的8個(gè)增加到12個(gè),布局更加緊密,對(duì)帶寬、延遲也提出了更高的要求。

          為此,小芯片間的通信通道升級(jí)為GMI3,最大帶寬達(dá)到36Gbps,吞吐能力翻番,同時(shí)與內(nèi)部基準(zhǔn)頻率的比例為20:1。

          針對(duì)不同數(shù)量的CCD,GMI還提供寬、窄兩種模式,其中超過(guò)4個(gè)CDD為寬模式,充分利用足夠的帶寬,小于等于4個(gè)則是窄模式,提高效率。

          五、CXL

          圖片

          CXL,也就是Compute EXpress Link,一種緩存一致性高速互連行業(yè)標(biāo)準(zhǔn),主要用于處理器、內(nèi)存擴(kuò)展與加速器。

          CXL有三種工作模式,EPYC 9004并不支持第一種(面向NIC網(wǎng)卡)、第二種(面向GPU/FPGA/加速器等密集計(jì)算),而僅支持第三種,也就是內(nèi)存緩沖,可擴(kuò)展內(nèi)存帶寬與容量,協(xié)議走的是cxl.io、cxl.mem。

          圖片

          總的來(lái)說(shuō),AMD EPYC 9004系列在延續(xù)chiplet設(shè)計(jì)的同時(shí),升級(jí)了工藝、架構(gòu),升級(jí)了內(nèi)存、擴(kuò)展連接等,整體規(guī)格、特性上了一個(gè)大大的臺(tái)階。

          此外,Zen EPYC家族還會(huì)陸續(xù)還會(huì)推出采用3D V-Cache技術(shù)的更高性能版“Genoa-X”,面向云計(jì)算服務(wù)的“Bergamo”(貝爾加莫),以及面向電信基礎(chǔ)設(shè)施和邊緣計(jì)算的“Siena”(錫耶納),組成完整的產(chǎn)品矩陣。

          未來(lái)的第五代“Turing”(圖靈)家族,還會(huì)再次升級(jí)全新的“Zen5”架構(gòu)!


          *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



          關(guān)鍵詞: 芯片

          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉