AMD能否撼動英偉達(dá)AI霸主地位
財報顯示,AMD第二季度的收入和盈利均兩位數(shù)下滑,但還沒有華爾街預(yù)期的降幅大:AMD當(dāng)季營收54億美元,分析師預(yù)期53.2億美元;二季度調(diào)整后運(yùn)營利潤率20%,分析師預(yù)期19.5%。
本文引用地址:http://cafeforensic.com/article/202308/449252.htmAMD首席執(zhí)行官蘇姿豐(Lisa Su)指出,二季度業(yè)績強(qiáng)勁得益于,數(shù)據(jù)中心業(yè)務(wù)中的第四代EPYC CPU和PC業(yè)務(wù)相關(guān)的Ryzen 7000 CPU銷售大幅增長。
同時,蘇姿豐在與分析師的電話會議上表示,到2027年,數(shù)據(jù)中心的人工智能加速器市場可能會超過1500億美元。個人電腦是推動半導(dǎo)體處理器銷量的傳統(tǒng)產(chǎn)品,但隨著個人電腦銷量下滑,人工智能芯片成為半導(dǎo)體行業(yè)的新亮點(diǎn)之一。
生成式AI和大語言模型(LLM)需要的算力和內(nèi)存大幅提高。預(yù)計今年,數(shù)據(jù)中心AI加速器的市場將達(dá)到300億美元左右,到2027年將超過1500億美元,復(fù)合年增長率超過50%。這意味著未來四年的CAGR將會超過50%。
AMD實現(xiàn)硬軟件關(guān)鍵里程碑
在今年5月公布一季度財報后,蘇姿豐就曾表示,AI現(xiàn)在是AMD的頭號優(yōu)先要務(wù),“雖然我們?nèi)蕴幱谌斯ぶ悄苄聲r代的早期階段,但很明顯,人工智能為AMD帶來了數(shù)十億美元的增長機(jī)會”。
AI是塑造下一代計算的決定性技術(shù),也是AMD最大的戰(zhàn)略增長機(jī)會。AMD正在增加AI相關(guān)的研發(fā)支出,并已經(jīng)制定AI戰(zhàn)略 —— 包括AI專用芯片和軟件的開發(fā),在實現(xiàn)硬軟件關(guān)鍵里程碑方面取得了巨大進(jìn)展。
· MI300A:MI300A是AMD為AI和高性能計算(HPC)打造的一系列最新APU加速卡之一,采用3D堆疊技術(shù)和Chiplet設(shè)計,配備了基于5nm制程的9個芯片組,置于基于6nm制程的4個芯片組之上,其晶體管數(shù)量達(dá)到1460億。其中有24個Zen 4 CPU核心,一個CDNA 3圖形引擎,內(nèi)置128GB的HBM3內(nèi)存。相較上一代的MI250X,MI300在AI上的算力(TFLOPS)預(yù)計能提升8倍,能耗性能(TFLOPS/watt)將優(yōu)化5倍。
· MI300X:MI300X是針對LLM設(shè)計的MI300A優(yōu)化版本,內(nèi)部沒有集成CPU內(nèi)核,而是采用基于CDNA 3架構(gòu)8個GPU芯粒以及另外4個I/O內(nèi)存芯粒組成的芯片,晶體管達(dá)到1530億個,是目前全球最大的邏輯處理器。內(nèi)存達(dá)到了192GB,內(nèi)存帶寬為5.2TB/s,Infinity Fabric帶寬為896GB/s,高內(nèi)存密度和高內(nèi)存帶寬使得MI300X在運(yùn)行大模型(如GPT-3、PaLM2等)方面更具優(yōu)勢。
基于MI300X,AMD還宣布了Instinct平臺,其搭載8顆MI300X,提供總計1.5TB的內(nèi)存,意味著該計算平臺能訓(xùn)練參數(shù)規(guī)模更大的大語言模型。
除了硬件,AMD也在加大軟件生態(tài)的投入,推出了用于數(shù)據(jù)中心加速、一套完整軟件棧工具AMD ROCm系統(tǒng),包括為PyTorch 2.0提供即時“零日”支持,AI模型“開箱即用”等。ROCm軟件棧可與模型、庫、框架和工具的開放生態(tài)系統(tǒng)配合使用,TensorFlow和Caffe深度學(xué)習(xí)框架也已加入第五代ROCm。
去年11月ChatGPT發(fā)布以來,人工智能領(lǐng)域?qū)λ懔Φ男枨罂涨疤嵘?,提供底層算力?a class="contentlabel" href="http://cafeforensic.com/news/listbylabel/label/英偉達(dá)">英偉達(dá)是最大的受益者,其GPU產(chǎn)品在AI大模型訓(xùn)練上幾無替代品。隨著AMD收購賽靈思完成后,其在AI領(lǐng)域的力度明顯加大,也希望把握生成式AI帶來的重大機(jī)遇。
此次MI300X新一代服務(wù)器處理器系列等產(chǎn)品披露進(jìn)展后,AMD的計算產(chǎn)品線將從CPU、GPU、FPGA、DPU延伸至軟件平臺,形成與英偉達(dá)的全面競爭格局。
欲與英偉達(dá)試比高
目前,英偉達(dá)在AI領(lǐng)域處于制霸地位,它在AI處理器市場上占據(jù)大約80%的份額,其高端處理器已被用于訓(xùn)練和運(yùn)行各種聊天機(jī)器人。
在2016年的GTC China大會上,黃仁勛就表示:“AI算力將是未來科技發(fā)展的核心,因此英偉達(dá)不再是一個半導(dǎo)體公司,而是一家AI計算公司”。之后一直專注于提升AI算力,成功搭上ChatGPT的浪潮,在2023年5月30日,英偉達(dá)市值突破萬億美金。再回過頭,英偉達(dá)已經(jīng)順AI之勢成了難以撼動的巨無霸。
面對五年復(fù)合增幅可達(dá)50%以上的市場需求量,AMD很難不心動,MI300新系產(chǎn)品線的亮相,或?qū)⒊蔀槟軌蚺c英偉達(dá)一決高下的“終極武器”。值得注意的是,因為多個客戶啟動或擴(kuò)大支持AMD Instinct加速器未來大規(guī)模部署的計劃,AMD的AI參與度在二季度增長了七倍多。
對標(biāo)英偉達(dá)AI芯片H100的大模型專用芯片,AMD的MI300X號稱HBM密度高達(dá)英偉達(dá)H100的2.4倍,HBM帶寬高達(dá)H100的1.6倍,單個芯片可運(yùn)行多達(dá)800億參數(shù)的模型,可以運(yùn)行比H100更大的模型,相比之下,H100芯片只能支持120GB的內(nèi)存。雖然英偉達(dá)在這一點(diǎn)上可能將很快迎頭趕上,甚至在相同的時間框架內(nèi)實現(xiàn)反超,但在這一新興市場的主導(dǎo)地位仍將受到挑戰(zhàn)。
隨著模型規(guī)模越來越大,需要多個GPU來運(yùn)行最新的大型語言模型,而當(dāng)MI300X配置更大的內(nèi)存,生成式AI模型可能就不再需要數(shù)目那么龐大的GPU,意味著可以節(jié)約成本。
AMD尚未公布MI300定價,但不難預(yù)測很可能將延續(xù)往日的高性價比定價風(fēng)格,重點(diǎn)關(guān)注先把市場打開。在全球算力緊張、英偉達(dá)芯片價格居高不下的情況下,很可能選擇在英偉達(dá)產(chǎn)品的價格上給壓力。
此前,AMD表示MI300系列芯片將于第三季度開始批量生產(chǎn),并將于第四季度開始量產(chǎn),并沒有透露具體有哪些公司將計劃購買MI300X或MI300A。
AMD真的能逆襲英偉達(dá)嗎?
AMD的MI300系列是目前從硬件水平上最接近H100的產(chǎn)品,但MI300X并沒有像H100的Transformer Engine(用加速Transformer大模型的引擎),H100可以將大語言模型(LLM)的性能提高兩倍,這也意味著用同樣數(shù)量的MI300X將花費(fèi)更長的訓(xùn)練時間。
同時算力的比拼,除了硬件端,其實還有軟件端的較量。MI300系列的發(fā)布雖然在硬件參數(shù)上努力實現(xiàn)對標(biāo),而在軟件端存在不少的差距,需要更多的時間來追趕。
英偉達(dá)CUDA軟件生態(tài)帝國早在2007年就開始起步,AMD的ROCm在2016年才發(fā)布,ROCm操作系統(tǒng)長期只支持Linux,最近才登錄Windows,但由于前期積累的較少,在開發(fā)者數(shù)量和軟件包數(shù)量上遠(yuǎn)遠(yuǎn)落后。在Github上,貢獻(xiàn)CUDA軟件包倉庫的開發(fā)者超過32600位,而ROCm只有不到600個,這很大程度影響了客戶的使用。
CUDA是一個完全封閉的系統(tǒng),綁定了百萬計的開發(fā)者。從2017年推出V100,到2020年推出A100,再到2022年推出H100,現(xiàn)如今英偉達(dá)的CUDA生態(tài)已經(jīng)積累了近250萬開發(fā)者,建立了其他競爭對手短時間難以逾越的護(hù)城河。
與英偉達(dá)獨(dú)有的CUDA生態(tài)不同,AMD推出ROCm生態(tài)圈,并實現(xiàn)通過HIP完全兼容CUDA,同時也與客戶包括微軟等合作重構(gòu)自己的生態(tài)。雖能完全兼容CUDA,為AMD提供了說服客戶遷移的條件和理由,但兼容只屬權(quán)宜之計,進(jìn)一步建立屬于自己的生態(tài)才能形成競爭優(yōu)勢。
目前可以真正兼容CUDA的除英偉達(dá)自身外就只有AMD一家,AMD和英偉達(dá)之間有相關(guān)的IP授權(quán),這樣AMD的MI系列GPU可以使用CUDA,其他初創(chuàng)企業(yè)都不能直接使用CUDA。
從技術(shù)層面來看,兼容意味著被動、落后,因為CUDA每一次升級,ROCm都需要做出對應(yīng)升級,技術(shù)團(tuán)隊無法將所有精力用于ROCm生態(tài)圈的迭代上,應(yīng)用場景和使用體驗都會落后于英偉達(dá)。
相比于英偉達(dá),AMD無疑落后了半個身位。此外,英偉達(dá)已經(jīng)在交付H100,并表示在未來幾個季度會增加產(chǎn)量,其產(chǎn)品已得到客戶的認(rèn)可和接受,并且已經(jīng)有完整的產(chǎn)業(yè)鏈為其供貨;而AMD的新品仍在試驗階段,還尚未披露任何基準(zhǔn)測試,可能到下半年才會交付,還有許多問題仍待解決。這或是市場有所保留的原因,新品推出都需要經(jīng)過市場長時間的驗證。
在行業(yè)景氣度持續(xù)上升的背景下,誰能率先完成獨(dú)有的軟件生態(tài),誰就有可能挑戰(zhàn)英偉達(dá)在訓(xùn)練芯片的市場地位,目前看最有機(jī)會的就是AMD。期待今年晚些時候能夠看到一些與同業(yè)競爭對手的比較。
有望帶動良性競爭
因為英偉達(dá)在算力芯片上具有絕對領(lǐng)先的地位,而當(dāng)前AI需求的激增讓A100、H100等產(chǎn)品供不應(yīng)求,其訂單已經(jīng)排至2024年,像H100在明年一季度之前都處于售罄狀態(tài)。
MI300X的推出給市場帶來打破英偉達(dá)“一家獨(dú)大”局面的希望,大模型玩家渴望通過使用更優(yōu)秀產(chǎn)品,以減少與OpenAI等廠商算力支持差距。雖然從短期看,兩家之間仍有不小的差距,但中長期的角度,市場追趕者的出現(xiàn)還是能加劇算力端的競爭,有助于降低AI芯片的價格,更利于技術(shù)的迭代和進(jìn)步。
潛在客戶對MI300非常感興趣,希望能夠在英偉達(dá)的芯片之外,還有一個替代的選項。如果AMD的MI300系列被開發(fā)者和服務(wù)器制造商當(dāng)成英偉達(dá)產(chǎn)品的替代品,就很可能意味著AMD將迎來一個有待開發(fā)的巨大市場。
AI芯片的競爭還是處在一片正在快速擴(kuò)張的藍(lán)海之中,隨著AI應(yīng)用越來越深入我們的生活,更加難以想象AI芯片市場的規(guī)模極限,其中留給AMD和英偉達(dá)的空間自然也足夠大。英偉達(dá)盡管通過長期積累建立了強(qiáng)大的優(yōu)勢,但還有足夠的市場需求等待AMD滿足,這也是后者的機(jī)會所在。
AI市場的競爭也是一場持久戰(zhàn),AMD在不斷進(jìn)行技術(shù)創(chuàng)新和市場布局,未來也有可能實現(xiàn)逆襲。無論是英偉達(dá)還是AMD,誰能笑到最后還是看長期的發(fā)展?jié)撃堋?/p>
另外,還有中央處理器巨頭英特爾最近也正調(diào)整發(fā)展戰(zhàn)略,以把握AI發(fā)展的契機(jī),開始發(fā)力人工智能芯片。AMD面對的競爭將會加劇,AI的戰(zhàn)役或才剛剛展開。
評論