AI算力應用中的光模塊產(chǎn)品
以ChatGPT為代表的AI大模型應用普及將推動算力需求快速增長,服務器產(chǎn)業(yè)鏈是其中重要的受益環(huán)節(jié)之一,AI計算的普及將推動服務器產(chǎn)業(yè)鏈光模塊向800G升級提速。
算力網(wǎng)絡驅動下光模塊市場需求預測光模塊是數(shù)據(jù)中心內部互連和數(shù)據(jù)中心相互連接的核心部件。100G和400G是主流產(chǎn)品,800G過去主要用在超算等領域。據(jù)LightCounting預計,2023年800G全球普及率僅0.62%。而以ChatGPT為代表的AI大模型,對數(shù)據(jù)中心內外的數(shù)據(jù)流量都提出了新要求,有望推動光模塊加速向800G升級。800G光模塊將從2025年底開始主導光模塊市場。
根據(jù)LightCounting的數(shù)據(jù),2016年至2020年,全球光模塊市場規(guī)模從58.6億美元增長到66.7億美元,預測2025年全球光模塊市場將達到113億美元,為2020年的1.7倍。從結構上看數(shù)通市場占60%,電信市場占40%左右。
AI算力場景光模塊應用情況
首先我們以英偉達的SuperPOD為例測算單顆GPU與光模塊的比例。測算僅考慮IB網(wǎng)絡對應的光模塊需求。以140個節(jié)點的集群為例,每臺舉例服務器需要8顆GPU芯片,共需140×8=1120顆芯片;集群中每20臺服務器組成一個SU(scalable units,可擴展單元),共7個SU。IB網(wǎng)絡架構下實現(xiàn)了完整的胖樹(Fat-Tree)拓撲結構,胖樹架構在訓練場景中最優(yōu)的配置是上下行端口數(shù)一樣,即無阻塞的網(wǎng)絡,具體來看:
第一層:每個SU 中配置8臺葉交換機,共有56臺葉交換機;
第二層:每10臺脊交換機組成一個交換機組Spine Group( SG),每個SU 的第一個葉交換機連接到SG1中的每個交換機,每個SU的第二個葉交換機連接到SG2中的每個交換機,共有80個脊交換機;
第三層:每14臺核心交換機組成一個交換機組Core Group(CG),對應共28個核心交換機。
使用系統(tǒng)的對應計算側和存儲側線纜全部采用AOC有源光纜,因此每個端口對應一個光模塊,即每條光纜對應2個光模塊,因此計算側和存儲側共需要(1120+1124+1120)×2+(280+92+288)×2=8048個光模塊,即單顆GPU對應所需200G光模塊數(shù)量約為1:7.2
DGX GH200超級計算機搭載256個超級芯片,每個超級芯片可視為一個服務器,通過交換機進行互聯(lián)。從結構上來看,超級計算機采用兩層的胖樹拓撲結構,第一、二層分別使用96個、36個交換機,每臺交換機擁有32個速率為800G的端口;此外超級計算機還配備了24個IB交換機用于IB網(wǎng)絡。按照端口進行估算,L1層距離較近因此假定使用銅纜進行連接不涉及光模塊,L2層36個交換機在無收斂胖樹架構下,第二層交換機端口向下與L1層交換機上行端口互聯(lián),因此共需要36×32×2=1152個800G光模塊;IB網(wǎng)絡架構下,24臺交換機需要24×32=768個800G光模塊;則DGX GH200超級計算機共需要1152+768=1920個800G光模塊,對應每顆芯片12個800G光模塊。則GPT-3單日完成訓練需要8萬顆以上200G光模塊,如果考慮到FLOPS的利用率約為20%-30%,則需要光模塊的數(shù)量將約為35萬顆。
易飛揚應用于算力場景的光模塊AI發(fā)展促進了海量光模塊需求,易飛揚則已于2023年完成800G/400G AI應用光模塊產(chǎn)線建設任務,新建成的生產(chǎn)線主要用于4×100G PAM4和8×100G PAM4光模塊和有源光纜的生產(chǎn)。
得益于供應鏈的支持,易飛揚的系列AI光模塊量產(chǎn)順利,公司本身的產(chǎn)品多樣化設計能力、訂單能力和供應鏈能力形成了較好的匹配關系。可以為中小客戶提供靈活有效的需求交付和樣品測試。
*博客內容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。