色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<optgroup id="6ieq8"><s id="6ieq8"></s></optgroup>

<strong id="6ieq8"><rt id="6ieq8"></rt></strong>

<center id="6ieq8"></center>

<sup id="6ieq8"></sup>

新聞中心

EEPW首頁 > 網(wǎng)絡(luò)與存儲 > 設(shè)計應(yīng)用 > PCIe結(jié)構(gòu)和RAID如何在GPUDirect存儲中釋放全部潛能

PCIe結(jié)構(gòu)和RAID如何在GPUDirect存儲中釋放全部潛能

作者：Microchip技術(shù)工程師 Wilson Kwong; Microchip產(chǎn)品營銷經(jīng)理 Sandeep Dattaprasad 時間：2023-01-05 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

隨著更快的圖形處理單元（GPU）能夠提供明顯更高的計算能力，存儲設(shè)備和GPU存儲器之間的數(shù)據(jù)路徑瓶頸已經(jīng)無法實現(xiàn)最佳應(yīng)用程序性能。NVIDIA的Magnum IO GPUDirect存儲解決方案通過在存儲設(shè)備和GPU存儲器之間實現(xiàn)直接路徑，可以極大地幫助解決該問題。然而，同等重要的是要使用容錯系統(tǒng)來優(yōu)化其已經(jīng)非常出色的能力，從而確保在發(fā)生災(zāi)難性故障時備份關(guān)鍵數(shù)據(jù)。該解決方案通過PCIe^?結(jié)構(gòu)連接邏輯RAID卷，在PCIe 4.0規(guī)范下，這可以將數(shù)據(jù)速率提高到26 GB/s。為了解如何實現(xiàn)這些優(yōu)勢，首先需要檢查該解決方案的關(guān)鍵組件及其如何協(xié)同工作來提供結(jié)果。

本文引用地址：http://cafeforensic.com/article/202301/442400.htm

Magnum IO GPUDirect存儲

Magnum IO GPUDirect存儲解決方案的關(guān)鍵優(yōu)勢是其能夠消除主要性能瓶頸之一，方法是不使用CPU中的系統(tǒng)存儲器將數(shù)據(jù)從存儲設(shè)備加載到GPU中進行處理。通常將數(shù)據(jù)移動到主機存儲器并傳送到GPU，這依賴于CPU系統(tǒng)存儲器中的回彈緩沖區(qū)，在數(shù)據(jù)傳送到GPU之前，會在其中創(chuàng)建數(shù)據(jù)的多個副本。但是，通過這種路徑移動大量數(shù)據(jù)會產(chǎn)生延遲時間，降低GPU性能，并在主機中占用許多CPU周期。借助Magnum IO GPUDirect存儲解決方案，無需訪問CPU并避免了回彈緩沖區(qū)效率低下（圖1）。

圖1. Magnum IO GPUDirect存儲解決方案無需訪問CPU，避免了從數(shù)據(jù)路徑回彈緩沖

性能直接隨著傳送數(shù)據(jù)量的增加而提高，傳送數(shù)據(jù)量則隨著人工智能（AI）、機器學(xué)習(xí)（ML）、深度學(xué)習(xí)（DL）和其他數(shù)據(jù)密集型應(yīng)用所需的大型分布式數(shù)據(jù)集呈指數(shù)級增長。當(dāng)數(shù)據(jù)在本地存儲或遠(yuǎn)程存儲時，可以實現(xiàn)這些優(yōu)勢，從而允許以比CPU存儲器中的頁面緩存更快的速度訪問數(shù)拍字節(jié)的遠(yuǎn)程存儲。

優(yōu)化RAID性能

該解決方案中的下一個元素是包括RAID功能，用于保持?jǐn)?shù)據(jù)冗余和容錯能力。雖然軟件RAID可以提供數(shù)據(jù)冗余，但底層軟件RAID引擎仍然使用精簡指令集計算機（RISC）架構(gòu)進行操作，例如奇偶校驗計算。當(dāng)比較高級RAID級別（例如RAID 5和RAID 6）的寫I/O延遲時間時，硬件RAID仍然比軟件RAID快得多，因為提供了專用處理器來執(zhí)行這些操作和回寫高速緩存。在流傳輸應(yīng)用中，軟件RIAD的長期RIAD響應(yīng)時間會導(dǎo)致數(shù)據(jù)堆積在高速緩存中。硬件RAID解決方案不存在緩存數(shù)據(jù)堆積問題，并且具有專門的備用電池，可以防止出現(xiàn)災(zāi)難性系統(tǒng)掉電時數(shù)據(jù)丟失的情況。

標(biāo)準(zhǔn)硬件RAID雖然減輕了主機的奇偶校驗管理負(fù)擔(dān)，但大量數(shù)據(jù)仍需經(jīng)過RAID控制器才能發(fā)送到NVMe^?驅(qū)動器，導(dǎo)致數(shù)據(jù)路徑更加復(fù)雜。針對此問題的解決方案是NVMe優(yōu)化的硬件RAID，該解決方案提供了簡化的數(shù)據(jù)路徑，無需經(jīng)過固件或RAID片上控制器即可傳送數(shù)據(jù)。它還允許維護基于硬件的保護和加密服務(wù)。

混合PCIe結(jié)構(gòu)

PCIe Gen 4現(xiàn)在是存儲子系統(tǒng)內(nèi)的基本系統(tǒng)互連接口，但標(biāo)準(zhǔn)PCIe交換網(wǎng)具有與前幾代相同的基于樹的基本層級。這意味著，主機間通信需要非透明橋接（NTB）來實現(xiàn)跨分區(qū)通信，這使其變得復(fù)雜，特別是在多主機多交換網(wǎng)配置中。Microchip的PAX PCIe高級結(jié)構(gòu)交換網(wǎng)等解決方案能夠克服這些限制，因為它們支持冗余路徑和循環(huán)，而這是使用傳統(tǒng)PCIe無法實現(xiàn)的。

結(jié)構(gòu)交換網(wǎng)具有兩個獨立的域，主機虛擬域（專用于每個物理主機）和結(jié)構(gòu)域（包含所有端點和結(jié)構(gòu)鏈路）。來自主機域的事務(wù)會在結(jié)構(gòu)域中轉(zhuǎn)換為ID和地址，反之，結(jié)構(gòu)域中通信的非分層路由也是如此。這樣，系統(tǒng)中的所有主機便可共享連接到交換網(wǎng)和端點的結(jié)構(gòu)鏈路。

在嵌入式CPU上運行的結(jié)構(gòu)固件通過可配置的下行端口數(shù)虛擬化符合PCIe標(biāo)準(zhǔn)的交換網(wǎng)。因此，交換網(wǎng)將始終顯示為具有直連端點的標(biāo)準(zhǔn)單層PCIe設(shè)備，而與這些端點在結(jié)構(gòu)中的位置無關(guān)。由于結(jié)構(gòu)交換網(wǎng)會攔截來自主機的所有配置平面通信（包括PCIe枚舉過程）并選擇最佳路徑，因此它可以實現(xiàn)這一點。這樣，GPU等端點便可綁定到域中的任何主機（圖2）。

圖2. 交換網(wǎng)固件虛擬化的主機域顯示為每個主機符合PCIe標(biāo)準(zhǔn)的單層交換網(wǎng)

在以下示例（圖3）中，我們給出了雙主機PCIe結(jié)構(gòu)引擎設(shè)置。此處，我們可以看到，結(jié)構(gòu)虛擬化允許每個主機看到一個透明PCIe拓?fù)?，其中包含一個上行端口、三個下行端口和三個連接到它們的端點，并且主機可以正確枚舉它們。圖3中的有趣之處是具有一個包含兩個虛擬功能的SR-IOV SSD，通過Microchip的PCIe高級結(jié)構(gòu)交換網(wǎng)，同一驅(qū)動器的虛擬功能可以共享給不同的主機。

圖3. 雙主機PCIe^?結(jié)構(gòu)引擎

這種PAX結(jié)構(gòu)交換網(wǎng)解決方案還支持在各結(jié)構(gòu)之間直接跨域點對點傳輸，因此可減少根端口阻塞并進一步緩解CPU性能瓶頸，如圖4所示。

圖4. 通過結(jié)構(gòu)路由通信，可減少根端口阻塞

性能優(yōu)化

在探索了NVMe驅(qū)動器和GPU之間數(shù)據(jù)傳輸?shù)男阅軆?yōu)化過程中涉及的所有組件之后，現(xiàn)在可以結(jié)合使用這些組件來實現(xiàn)預(yù)期的結(jié)果。說明這一點的最佳方式是利用圖示演示各個步驟，圖5顯示了主機CPU及其根端口以及可實現(xiàn)最佳結(jié)果的各種配置。

如圖5左側(cè)所示，盡管使用的是高性能NVMe控制器，但由于根端口的開銷，PCI Gen 4 x 4（4.5 GB/s）的最大數(shù)據(jù)速率也限制為3.5 GB/s。不過，通過RAID（邏輯卷）同時聚合多個驅(qū)動器（如右側(cè)所示），SmartRAID控制器可為四個NVMe驅(qū)動器各創(chuàng)建兩個RAID卷，并通過根端口創(chuàng)建傳統(tǒng)PCIe點對點路由。這會將數(shù)據(jù)速率提高到9.5 GB/s。

但是，利用跨域點對點傳輸（底部的圖），可以通過結(jié)構(gòu)鏈路而不是根端口來路由通信，從而實現(xiàn)26 GB/s的速率，這是使用SmartROC 3200 RAID控制器可達到的最高速率。在最后一個場景中，交換網(wǎng)提供不受固件影響的直接數(shù)據(jù)路徑，并且仍然保持基于硬件的RAID保護和加密服務(wù)，同時充分利用GPUDirect存儲的全部潛能。

圖5. 實現(xiàn)26 GB/s的路徑

總結(jié)

高性能PCIe結(jié)構(gòu)交換網(wǎng)（例如Microchip的PAX）允許多主機共享支持單根I/O虛擬化（SR-IOV）的驅(qū)動器，以及動態(tài)劃分可在多個主機之間共享的GPU和NVMe SSD池。Microchip的PAX結(jié)構(gòu)交換網(wǎng)可以將端點資源動態(tài)重新分配給需要這些資源的任何主機。

這種解決方案還使用了SmartROC 3200 RAID控制器系列支持的SmartPQI驅(qū)動程序，因此無需自定義驅(qū)動程序。Microchip的SmartROC 3200 RAID控制器是目前惟一能夠提供最高傳輸速率（即26 GB/s）的設(shè)備。它具有極低的延遲時間，可向主機提供最多16個PCIe Gen 4通道，并向后兼容PCIe Gen 2。與Microchip基于Flashtec^?系列的NVMe SSD結(jié)合使用時，可在多主機系統(tǒng)中發(fā)揮PCIe和Magnum IO GPUDirect存儲的全部潛能?？傮w而言，上述所有特性使其能夠構(gòu)建一種強大的系統(tǒng)，該系統(tǒng)可以滿足AI、ML、DL以及其他高性能計算應(yīng)用的實時需求。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： PCIe RAID GPUDirect存儲

評論

相關(guān)推薦

鎧俠CFMS2024：加速PCIe 5.0 SSD普及，探索未來存儲新生態(tài)

網(wǎng)絡(luò)與存儲鎧俠 CFMS2024 PCIe 5.0 SSD 中國閃存市場峰會 | 2024-03-22

從物理層到協(xié)議層、從一致性測試到故障排除，泰克全新PCIE解決方案幫助您化繁為簡，為您提供全方位解決方案

視頻 Tektronix PCIE 故障排除 | 2013-08-29

PCIe1.1_Compliance.part1

資源下載 PCIe 1.1 Compliance | 2009-03-07

PCIe 6.0準(zhǔn)備好在2024年開始商用數(shù)據(jù)傳輸可達64MT/s

網(wǎng)絡(luò)與存儲 PCIe 是德科技 Alphawave 新思英特爾 | 2024-01-02

pcie深入理解

菜鳥求教 | 2013-11-06

PCIE標(biāo)準(zhǔn).pdf

zxopenljx | 2020-06-13

RAID數(shù)據(jù)存儲系統(tǒng)

資源下載 RAID 數(shù)據(jù)存儲系統(tǒng) SCSI ISCSI 光纖通道 | 2007-08-27

新思科技推出業(yè)界首款PCIe 7.0 IP解決方案，加速HPC和AI等萬億參數(shù)領(lǐng)域的芯片設(shè)計

EDA/PCB 新思科技 PCIe 7.0 IP解決方案 HPC AI 芯片設(shè)計 | 2024-06-18

AmpereOne-3 芯片明年亮相：256核，支持 PCIe 6.0 和 DDR5

EDA/PCB AmpereOne-3 芯片 256核 PCIe 6.0 DDR5 | 2024-04-28

PCIe 7.0有什么值得你期待！

網(wǎng)絡(luò)與存儲高速傳輸 PCIe 7.0 | 2024-05-05

安森美半導(dǎo)體新一代外圍組件快速互連(PCIe)方案優(yōu)化服務(wù)器時鐘應(yīng)用

設(shè)計方案安森美 PCIe 數(shù)字消費云計算 | 2015-08-17

HT高速總線及其在嵌入式系統(tǒng)中的應(yīng)用

資源下載 HT總線 PCIe PCI 嵌入式系統(tǒng) | 2009-02-19

業(yè)界最小尺寸的 PCI Express 時鐘 IC，可將功耗降低60%

設(shè)計方案 Si50122 時鐘發(fā)生器芯片低功耗 PCIe | 2015-09-27

PCIe QuickLearn 4——擴頻時鐘

視頻 Microchip PCIe Microchip應(yīng)用方案 | 2021-04-20

英特爾Arrow Lake芯片組圖顯示更多PCIe通道，不支持DDR4

嵌入式系統(tǒng) 英特爾 Arrow Lake 芯片組 PCIe DDR4 | 2024-07-02

還在為PCIe交換機應(yīng)用選擇而煩惱？請看這里！

設(shè)計方案 PEX9700 PCIe交換機 PCIe 3.0 | 2015-11-03

PCIe 6.0和7.0標(biāo)準(zhǔn)遇到了障礙

網(wǎng)絡(luò)與存儲 PCIe 6.0 | 2024-06-25

PCIe1.1_Compliance.part2

資源下載 PCIe 1.1 Compliance | 2009-03-07

PCIe QuickLearn 2——時鐘架構(gòu)和要求

視頻 Microchip PCIe Microchip應(yīng)用方案 | 2021-03-17

PCI數(shù)據(jù)采集卡的DMA和中斷實現(xiàn).pdf

zxopenljx | 2020-10-28

存儲器與服務(wù)器指南

資源下載 Xilinx SAN RAID | 2007-04-25

FPGA開發(fā)板 PCIE X1 X2 X4 DDR2 光模塊 RJ45 交換機 PCIE開發(fā) 持續(xù)更新六個月

iihacker | 2014-01-04

美光首款M.2 2230 PCIe 4.0 SSD推出

網(wǎng)絡(luò)與存儲美光 M.2 2230 PCIe 4.0 SSD | 2024-07-19

高速傳輸需求飆升 PCIe訊號測試不妥協(xié)

測試測量高速傳輸 PCIe 訊號測試 | 2024-03-18

PCIe傳輸復(fù)雜性日增高速訊號測試不可或缺

測試測量 PCIe 高速訊號測試 | 2024-05-05

基于Xilinx FPGA的PCIe方案

設(shè)計方案 Xilinx FPGA PCIe | 2014-12-16

什么是RAID？ raid 1,raid 3 ,raid 5

dolphin | 2014-06-12

基于AXIe 中 PCIe 高帶寬的高速圖形傳輸系統(tǒng)

設(shè)計方案高速圖形傳輸 PCIe E-Beam 微影技 | 2015-09-04

PCIe QuickLearn 1——PCIe概述：數(shù)據(jù)

視頻 Microchip SAM9x6 PCIe Microchip應(yīng)用方案 | 2021-03-17

PCIe QuickLearn 3——測量參考時鐘抖動

視頻 Microchip PCIe Microchip應(yīng)用方案 | 2021-04-20

焦點

推薦視頻

技術(shù)專區(qū)

<delect id="e82gi"><abbr id="e82gi"></abbr></delect>

<delect id="e82gi"></delect>

<sup id="e82gi"></sup>

<kbd id="e82gi"><del id="e82gi"></del></kbd>

<center id="e82gi"></center>

<strong id="e82gi"><nav id="e82gi"></nav></strong>