收購兩家公司后,AMD推出新型DPU
來源:內(nèi)容由半導(dǎo)體行業(yè)觀察(ID:icbank)編譯自hpcwire
AMD 剛剛完成對 FPGA 供應(yīng)商Xilinx(2022 年 2 月)和 DPU 供應(yīng)商Pensando (2022 年 5 月)的收購,日前在Hot Chips上,他們預(yù)覽了它所謂的 400 Gig Adaptive smartNIC SOC 。在日益擁擠和模糊的 smartNIC/DPU 領(lǐng)域,它是另一個(gè)競爭者,區(qū)分兩者并不總是那么容易。
從 Xilinx 加入 AMD 的 Jaideep Dastidar 提出的這些設(shè)備類型的動(dòng)機(jī)與近年來Nvidia、Intel 和其他公司的演示非常相似。主機(jī) CPU 忙于處理家務(wù)(網(wǎng)絡(luò)、存儲(chǔ)、安全任務(wù))。由于性能和帶寬需求的增加、資源的分解以及軟件定義一切的興起,這使情況變得復(fù)雜。
Dastidar 說:“轉(zhuǎn)向 smartNIC 和 DPU 的原因是始于行業(yè)向軟件定義網(wǎng)絡(luò)的發(fā)展,它迅速擴(kuò)展到軟件定義的存儲(chǔ),在你知道之前,你已經(jīng)擁有了軟件定義的一切. 同時(shí),速度和饋送的無情發(fā)展仍在繼續(xù),網(wǎng)絡(luò)帶寬迅速增加了 25、50、100、200 gig。虛擬化水平也擴(kuò)大了,你擁有虛擬機(jī),個(gè)位數(shù) (VM) 已經(jīng)上升到 10 位,并且通過容器化,你正在處理 1000 多個(gè)虛擬實(shí)體?!?/p>
“所有這些都導(dǎo)致了 CPU 負(fù)擔(dān)過重的情況。因此,CPU 不是運(yùn)行多租戶應(yīng)用程序,而是被運(yùn)行數(shù)據(jù)中心基礎(chǔ)設(shè)施所吸收。因此,smartNIC 和 DPU 提供了幫助,因?yàn)樗鼈冇兄趶闹鳈C(jī) CPU 卸載這些工作負(fù)載,然后主機(jī) CPU 可以重新專注于多租戶云應(yīng)用程序?!盌astidar接著說。
到目前為止,這是一個(gè)熟悉的信息。觀察市場如何演變將會(huì)很有趣。AMD 正在將其 smartNIC 推廣為一種靈活高效的 SOC,它在適當(dāng)?shù)那闆r下利用固定邏輯 ASIC 技術(shù)、在適當(dāng)情況下利用更靈活的可編程邏輯 (FPGA) 和嵌入式處理器內(nèi)核。當(dāng)然,AMD 將自己定位為所有三種技術(shù)(ASIC、FPGA 和 CPU/內(nèi)核)的強(qiáng)大供應(yīng)商。
與其他公司一樣,AMD 也在其系統(tǒng)中加入了先進(jìn)的安全管理。用例可能非常多樣,涵蓋網(wǎng)絡(luò)管理、存儲(chǔ)管理和安全性。對 CXL 2.0 的支持值得注意。
“CXL 絕對是一項(xiàng)新興技術(shù)。在第二類設(shè)備中,您可以緩存主機(jī)內(nèi)存,也可以擁有加速的設(shè)備附加內(nèi)存。現(xiàn)在,通過可編程邏輯,我們只是想提供靈活性,以便您可以將 smartNIC 作為傳統(tǒng)的 PCIe 端點(diǎn)連接,但您也可以探索用例。從 CXL 的角度來看,您需要大量的生態(tài)系統(tǒng)支持,因此我們只是在創(chuàng)建能力——?jiǎng)?chuàng)建基礎(chǔ)技術(shù)——以便人們可以去探索可能作為第二類 CXL 運(yùn)行得更好的不同用例設(shè)備,”Dastidar說。
Dastidar 提供了 AMD 設(shè)計(jì)思維之旅:“我們決定采用傳統(tǒng)的硬件-軟件協(xié)同設(shè)計(jì)范式,并將其擴(kuò)展到硬件-軟件-可編程邏輯協(xié)同設(shè)計(jì)。您在右圖(上圖)中看到的內(nèi)容,在頂部,我們將 ASIC 邏輯應(yīng)用在它最擅長的地方:加密卸載、DMA 卸載,甚至是完整的網(wǎng)絡(luò)數(shù)據(jù)平面卸載。然后,當(dāng)您按順時(shí)針方向前進(jìn)時(shí),我們添加了 ASIC 到可編程邏輯適配器,您開始希望在其中進(jìn)行分層,例如custom header extensions。繼續(xù)順時(shí)針方向,您還可以在可編程邏輯中完全熱添加或刪除新的加速器功能。然后,如果您想一直傾斜天平,我們還希望能夠讓 SOC 執(zhí)行完整的自定義數(shù)據(jù)平面卸載。
“繼續(xù)順時(shí)針方向。當(dāng)您有需要與嵌入式處理子系統(tǒng)交互的可編程邏輯代理時(shí),我們有軟件到可編程邏輯適配器接口,這樣您就可以創(chuàng)建與嵌入式處理器子系統(tǒng)交互的一致 IO 代理?,F(xiàn)在,嵌入式處理子系統(tǒng)的尺寸已被確定為運(yùn)行網(wǎng)絡(luò)控制平面。如果您注意到,這是我們第一次提到控制平面。與此同時(shí),數(shù)據(jù)平面正在被完全執(zhí)行,無論是在 ASIC 邏輯還是可編程邏輯或兩者的組合中,”他說。
在遙測功能( telemetry functionality)方面,Dastidar 表示,雖然遙測數(shù)據(jù)是 SOC 范圍的,但嵌入式處理子系統(tǒng)是“收集所有遙測數(shù)據(jù)、合成數(shù)據(jù)、然后將其上傳到云管理平面(如果他們選擇)的最佳位置?!?/p>
SOC將采用臺(tái)積電的7nm工藝制造,由功能塊組成。雖然 Dastidar 提供了大量有關(guān)功能和支持的特性的材料,但他很少提及所需的編程工具是什么。
如上圖所示,AMD 已將這些設(shè)計(jì)理念映射到自適應(yīng) SOC 內(nèi)的特定子系統(tǒng)中。主機(jī)子系統(tǒng)包含主機(jī)連接和主機(jī)域加速。包含網(wǎng)絡(luò)連接和網(wǎng)絡(luò)域加速的網(wǎng)絡(luò)子系統(tǒng)。處理子系統(tǒng)包含所有嵌入式處理核心。
Dastidar 說:“雖然這里以視覺方式顯示,但我希望您將可編程邏輯元件和內(nèi)存子系統(tǒng)視為具有芯片普遍連接和訪問的芯片普遍資源。片上可編程網(wǎng)絡(luò)進(jìn)一步增強(qiáng)了這種連接性,[它]允許子系統(tǒng)到子系統(tǒng)的數(shù)據(jù)移動(dòng),并且任何子系統(tǒng)都可以根據(jù)架構(gòu)選擇訪問公共內(nèi)存位置?!?/p>
Dastidar 還遍歷了每個(gè)子系統(tǒng)。這是他對主機(jī)子系統(tǒng)的描述的片段。
“主機(jī)連接可以是單個(gè)主機(jī) PCIe Gen 5 x16 連接到 smartNIC?;蛘撸梢砸恢边B接到 smartNIC 的四主機(jī) 4x Gen 5 x4 連接。此外,控制器支持 CXL 2.0,它們可以支持第一類、第二類或第三類 CXL 設(shè)備?,F(xiàn)在,正如我之前提到的,PCIe 控制器已升級(jí)到最新的 PCIe ECN 安全標(biāo)準(zhǔn)。例如,PCIe CMA(組件測量和身份驗(yàn)證)、PCIe DOE(設(shè)備對象交換)、PCIe IDE(完整性和數(shù)據(jù)加密)和控制器還支持 TDISP,它允許受信任的 VM 以機(jī)密計(jì)算方式與端點(diǎn)通信, ”達(dá)Dastidar說。
“中間的塊是可組合的 DMA 引擎。這是一個(gè)分層的數(shù)據(jù)移動(dòng)器。雖然它可以繼續(xù)進(jìn)行主機(jī)到卡 [和] 卡到主機(jī)數(shù)據(jù)移動(dòng)的傳統(tǒng)卸載,它還可以促進(jìn)子系統(tǒng)到子系統(tǒng)的數(shù)據(jù)移動(dòng),并且它可以引導(dǎo)主機(jī)到卡的數(shù)據(jù)數(shù)據(jù)傳輸?shù)教囟ㄗ酉到y(tǒng),無論是網(wǎng)絡(luò)子系統(tǒng)、可編程邏輯還是處理子系統(tǒng)?!?/p>
顯示其他三個(gè)子系統(tǒng)的幻燈片包含在文章的末尾。
還有很多東西需要消化和解包。Dastidar 沒有透露該產(chǎn)品何時(shí)推出。值得注意的是,新的 smartNIC 基于 Xilinx 的 Versal ACAP(自適應(yīng)計(jì)算加速平臺(tái))smartNIC 架構(gòu)。在問答期間,Dastidar 對有關(guān)區(qū)分 AMD 的新 smartNIC 與 Pensando DPU 和 Xilinx 的 Versal smartNIC 的問題的回答有點(diǎn)模糊。
“[我們發(fā)現(xiàn)] Xilinx smartNIC 技術(shù)和 Pensando DPU 技術(shù)的結(jié)合非常相得益彰。數(shù)據(jù)中心的不同客戶有不同的參與模式?,F(xiàn)在 AMD 提供的這種廣泛的產(chǎn)品組合讓客戶可以選擇參與其中的任何一種模式。您知道數(shù)據(jù)中心中的部署不是同質(zhì)的。在某些情況下,客戶可能會(huì)發(fā)現(xiàn)基于自適應(yīng) SOC 的智能網(wǎng)卡對數(shù)據(jù)中心中的某個(gè)節(jié)點(diǎn)特別有吸引力,而 Pensando 的基于 DPU 的智能網(wǎng)卡也非常有吸引力。我們注意到的一個(gè)常見元素是對客戶易用性的高度關(guān)注。從文化的角度來看,在客戶如何與這個(gè) SOC 以及 Pensando 交互方面,無論是從自適應(yīng) SOC 來看,兩者都非常接近。有很多投資。
AMD 與 Xilinx 和 Pensando 的合并仍處于早期階段,產(chǎn)品線整合和協(xié)調(diào)尚未解決也許不足為奇。smartNIC/DPU 市場正迅速變得更加擁擠,這值得關(guān)注。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。
存儲(chǔ)器相關(guān)文章:存儲(chǔ)器原理