三款芯片,英偉達(dá)的量身定制
據(jù)報(bào)道,全球最大的圖形芯片供應(yīng)商英偉達(dá)將在今年第二季度為中國大陸客戶量產(chǎn)三款精簡(jiǎn)版人工智能(AI)芯片。
本文引用地址:http://cafeforensic.com/article/202401/455060.htm這家總部位于美國加州的公司原計(jì)劃于去年 11 月為中國市場(chǎng)推出三款 AI 芯片——H20、L20 和 L2,但由于該公司希望檢查這些芯片是否符合美國的出口管制,因此推遲到 2024 年推出。
根據(jù)加拿大科技新聞網(wǎng)站 Wccftech 發(fā)表的一篇文章,這三款芯片完全符合美國的出口政策,并將在今年第二季度生產(chǎn)。
報(bào)告稱,第一批 H20 芯片可能會(huì)在 2024 年第二季度中后期交付給客戶。
「在參數(shù)方面,H20 的性能密度和計(jì)算能力符合美國的出口政策」,一家深圳公司的一位中國作者在周二發(fā)表的一篇文章中說。他說,在 FP8 Tensor Core 操作中,H20 的速度為每秒 296 萬億次浮點(diǎn)運(yùn)算(teraflops 或 tflops),而 H100 為 1979 tflops,H200 為 3958tflops。H200 是世界上最強(qiáng)大的 AI 芯片,比 H20 快 13 倍。
同時(shí),已公布的報(bào)道表明,H20 是一臺(tái)相對(duì)精益求精的機(jī)器。Semianalysis 分析師迪倫·帕特爾(Dylan Patel)在去年 11 月發(fā)表的一篇文章中表示,在大型語言模型(LLM)推理方面,H20 實(shí)際上比 H100 快 20% 以上,這可用于使用非常大的數(shù)據(jù)集生成內(nèi)容。他說,雖然 H100 比 H20 快 6.68 倍,但在衡量其性能時(shí),人們還應(yīng)該考慮 MFU(模型 FLOP 利用率)或?qū)嶋H利用率。
由于 H100 的 MFU 只有 38.1%,而 H20 可以達(dá)到 90%,因此,H20 在實(shí)際多 GPU 互聯(lián)環(huán)境下的性能接近 H100 的 50%。
其他技術(shù)專家表示,H20 在功耗方面具有優(yōu)勢(shì),因?yàn)樗臒嵩O(shè)計(jì)功率為 400 瓦,低于 H100 的 700 瓦。
中國市場(chǎng)
這個(gè)傳奇可以追溯到 2022 年 8 月,當(dāng)時(shí)拜登政府禁止向中國大陸和俄羅斯出口英偉達(dá)的 A100 和 H100,以及 AMD 的 MI250 芯片,因?yàn)檫@些芯片具有很高的互連帶寬——每秒 600 GB 或更高。
針對(duì)中國大陸市場(chǎng),英偉達(dá)隨后推出了 A800 和 H800 處理器,它們分別以每秒 400 GB 和 300 GB 的速度工作。IT 專家表示,A800 和 H800 的性能分別是 A100 和 H100 的 70% 左右。
2023 年 10 月 17 日,美國商務(wù)部工業(yè)與安全局(BIS)表示,將使用「性能」和「性能密度」作為新參數(shù)對(duì)受限芯片進(jìn)行分類。根據(jù)新規(guī)定,英偉達(dá)的 A800、H800、L40、L40S 和 RTX 4090 芯片被禁止運(yùn)往中國大陸。英偉達(dá)希望通過將 H20 運(yùn)往該國來填補(bǔ)由此產(chǎn)生的空白。
一些分析師表示,如果這款新芯片能夠達(dá)到 H100 速度的 50%,而功耗比 H100 低 43%,那么它可能會(huì)對(duì)中國客戶有吸引力。
「雖然 H20 的計(jì)算能力低于 H100,但它的價(jià)格會(huì)更低,并且支持英偉達(dá)的特殊功能,如 NVLink 和 CUDA 平臺(tái)」,總部位于香港的 TF 國際證券集團(tuán)有限公司的技術(shù)分析師郭明錤說:「中國客戶仍然對(duì) H20 芯片有濃厚的興趣?!?/p>
最新特規(guī)版顯卡
英偉達(dá)于近期發(fā)布了搭載 AD102-250 的中國特規(guī)版顯卡,名為 GeForce RTX 4090D,取代限制出口的旗艦產(chǎn)品 GeForce RTX 4090。
2023 年 10 月 17 日美國對(duì)中國大陸出口的人工智能相關(guān)芯片、半導(dǎo)體制造設(shè)備祭出嚴(yán)格限制,導(dǎo)致英偉達(dá)高端游戲市場(chǎng)的顯卡 GeForce RTX 4090 在中國大陸銷售受限,為解決這個(gè)問題,決定開發(fā)定制化的 GeForce RTX 4090 D 顯卡,通過降低部份規(guī)格,以符合美國出口管制要求。
因應(yīng)美國政府對(duì)中國人工智能芯片最新出口管制,RTX 4090 D 需要滿足綜合運(yùn)算性能(TPP)4800 限制,RTX 4090 無論 FP8 還是 FP16 的 TPP 都是 5286,比限制值超出 10% 左右。
正常來說,英偉達(dá)需要在 RTX 4090 基礎(chǔ)上適當(dāng)削減規(guī)格,最直接就是減少 SM、Tensor 和 CUDA 等配置數(shù)量,但是,RTX 4090D 要與 RTX 4080 SUPER 之間保持一定的距離。
英偉達(dá)表示,將持續(xù)完全地遵守美方規(guī)定,英偉達(dá)確實(shí)提供服務(wù)給在新加坡的中國大陸客戶,包括字節(jié)跳動(dòng)、騰訊的國際云端事業(yè)與阿里巴巴集團(tuán)。申報(bào)文件顯示,英偉達(dá)對(duì)在新加坡的客戶(包括陸企)銷售額,占整體營收約 15%。
RTX 4090 D 和 RTX 4090 都使用臺(tái)積電 N4 制程,若獲得美國商務(wù)部核準(zhǔn),將成為英偉達(dá)中國市場(chǎng)逆轉(zhuǎn)勝關(guān)鍵。
相對(duì)于中國競(jìng)爭(zhēng)對(duì)手的優(yōu)勢(shì)正在縮小
H20 在性能和效率上仍比中國本土 AI 芯片具有優(yōu)勢(shì),但這種優(yōu)勢(shì)正在縮小。在政策和財(cái)政支持下,許多中國本土芯片廠商正在快速增長(zhǎng),有朝一日將打破英偉達(dá)在人工智能芯片市場(chǎng)的壟斷地位。
事實(shí)上,一些中國大陸科技公司已經(jīng)轉(zhuǎn)向使用本地芯片。
英偉達(dá)面臨的壓力可能會(huì)減弱。2023 年 12 月 2 日,美國商務(wù)部長(zhǎng)吉娜·雷蒙多(Gina Raimondo)在一個(gè)論壇上表示,如果任何一家美國公司圍繞特定的切割線重新設(shè)計(jì)其芯片,使中國公司能夠進(jìn)行人工智能,美國政府將在第二天控制它。
不能排除這樣一種可能性,即如果 H20 的表現(xiàn)確實(shí)能達(dá)到 H100 的 50%,雷蒙多可能會(huì)進(jìn)一步收緊出口規(guī)則。
評(píng)論