色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁 > 智能計算 > 編輯觀點 > 英偉達發(fā)布Blackwell芯片,再次證明統(tǒng)治力

          英偉達發(fā)布Blackwell芯片,再次證明統(tǒng)治力

          作者:陳玲麗 時間:2024-03-21 來源:電子產(chǎn)品世界 收藏

          隨著人工智能革命席卷而來,抓住生成式機會的全面出擊,為大小挑戰(zhàn)者設(shè)下新標桿。3月19日,在2024年GTC大會上發(fā)布Hopper架構(gòu)的繼任者 —— 全新架構(gòu)平臺,包括AWS、微軟和谷歌在內(nèi)的公司計劃將其用于生成人工智能和其他現(xiàn)代計算任務(wù)。

          本文引用地址:http://cafeforensic.com/article/202403/456644.htm

          的形態(tài)已徹底改變

          架構(gòu)“”得名于美國數(shù)學家David Harold ,與Grace CPU、新一代網(wǎng)絡(luò)等產(chǎn)品一起,面向生成式共同組成完整解決方案。黃仁勛稱Blackwell不只是芯片,而是一個全新的平臺。這意味著英偉達從芯片走向平臺的轉(zhuǎn)變。

          基于該架構(gòu)的芯片B200采用臺積電4NP制造工藝,密度方面應(yīng)該不會有明顯的提升,而之前的H100基本上已經(jīng)是一個完整的掩模版,芯片尺寸為814mm2,而理論最大值為858mm2。為此B200使用了兩個全尺寸掩模版制造的芯片,每個對應(yīng)四個HBM3E堆棧,每個堆棧的接口容量為24GB、帶寬為1TB/s。相比之下,每個H100芯片對應(yīng)六個HBM3接口,意味著B200每個芯片可以減少內(nèi)存控制器所需要的芯片面積,從而將更多的晶體管用于計算單元。

          640.gif

          B200并不是傳統(tǒng)意義上的單一GPU,相反它由兩個緊密耦合的芯片組成,通過10TB/s NV-HBI(高帶寬接口)進行連接,以確保它們能夠作為單個完全一致的芯片正常運行。B200總晶體管數(shù)量達到2080億個、內(nèi)存帶寬達到8TB/s、擁有20 petaflops的性能,英偉達稱其可實現(xiàn)在十萬億級參數(shù)模型上的AI訓練和實時LLM(大語言模型)推理。

          GPU的形態(tài)已徹底改變。需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。Blackwell新架構(gòu)硬件產(chǎn)品線都圍繞這一句話展開,通過芯片與芯片間的連接技術(shù),一步步構(gòu)建出大型AI超算集群。

          兩個B200 GPU與Grace CPU結(jié)合就成為GB200超級芯片,通過900GB/s的超低功耗NVLink芯片間互連技術(shù)連接在一起,將能夠使大模型推理工作負載的性能提升30倍,同時提高效率。相比于H100,它可以將成本和能源消耗降至1/25,而在參數(shù)為1750億的GPT-3 LLM基準測試中,GB200的性能達到了H100的7倍,而訓練速度則達到了H100的4倍。GB200將于今年晚些時候在NVIDIA DGX Cloud上以及通過AWS、谷歌云和Oracle云基礎(chǔ)設(shè)施實例提供。

          640-2.gif

          在多卡互聯(lián)方面,英偉達的NVLink和NVSwitch技術(shù)是其護城河。NVLINK是一種點對點的高速互連技術(shù),可以將多個GPU直接連接起來,第五代NVLink在多達576個GPU之間可提供1.8TB/s的每GPU雙向通信吞吐量;同時NVLink引入了統(tǒng)一內(nèi)存的概念,支持連接的GPU之間的內(nèi)存池,這對于需要大型數(shù)據(jù)集的任務(wù)來說是一個至關(guān)重要的功能。而NVSwitch是一種高速交換機技術(shù),可以將多個GPU和CPU直接連接起來,形成一個高性能計算系統(tǒng)。

          “新一代計算單元”GB200 NVL72由此誕生,GB200 NVL72是一個全機架解決方案,有18個1U服務(wù)器,每臺服務(wù)器里帶有兩個GB200,合計共有36個Grace CPU和72個B200,并且全部采用液冷MGX封裝。黃仁勛在介紹此臺機器時說道:“此時此刻,地球上也許只有三臺百億億次浮點運算(exaflop)機器。而這是一個單一機架中的1個百億億次浮點運算AI系統(tǒng)?!?/p>

          640.jpeg

          值得注意的是,為了獲得最高的AI性能,基于GB200的系統(tǒng)可以與同期發(fā)布的Quantum-X800 InfiniBand和Spectrum-X800以太網(wǎng)平臺連接,可提供速度高達800Gb/s的高級網(wǎng)絡(luò),配合散熱系統(tǒng)組成新一代DGX SuperPod集群。DGX GB200 SuperPod采用新型高效液冷機架規(guī)模架構(gòu),標準配置可在FP4精度下提供11.5 exaflops算力和240TB高速內(nèi)存,并可通過額外的機架進行擴展。

          此外,Blackwell支持的GPU包含RAS專用引擎,實現(xiàn)可靠性、可用性和服務(wù)性;還增加了芯片級功能,利用基于AI的預防性維護進行診斷和預測可靠性問題。這可以最大限度地延長系統(tǒng)正常運行時間,并提高大部署規(guī)模AI的彈性,使其能連續(xù)運行數(shù)周甚至數(shù)月,并降低運營成本。

          “這樣我們可以大量地節(jié)省能源、網(wǎng)絡(luò)帶寬量和時間?!秉S仁勛表示,“未來將是可生成的,這就是為什么這是一個全新的行業(yè)。我們的計算方式有本質(zhì)差異,所以英偉達為生成式AI時代打造了一款全新處理器?!?/strong>

          進軍機器人領(lǐng)域

          在GTC上,黃仁勛展示了多個由GR00T驅(qū)動的人形機器人如何完成各種任務(wù),包括來自Agility Robotics、Apptronik、傅利葉智能(Fourier Intelligence)和宇樹科技(Unitree Robotics)的機器人產(chǎn)品。GR00T驅(qū)動的機器人將能夠理解自然語言,并通過觀察人類行為來模仿動作。

          英偉達過去針對機器人市場的Isaac機器人平臺也得到重大更新,發(fā)布了一款基于Thor芯片的新型人形機器人計算機Jetson Thor。據(jù)介紹,Jetson Thor是一個全新的計算平臺,能夠執(zhí)行復雜的任務(wù)并安全、自然地與人和機器交互,具有針對性能、功耗和尺寸優(yōu)化的模塊化架構(gòu)。

          該SoC包括一個帶有transformer engine的下一代GPU,其采用英偉達Blackwell架構(gòu),可提供每秒800萬億次8位浮點運算AI性能,以運行GR00T等多模態(tài)生成式AI模型。憑借集成的功能安全處理器、高性能CPU集群和100GB以太網(wǎng)帶寬,大大簡化了設(shè)計和集成工作。

          為了幫助機器人更好地感知所處環(huán)境,還發(fā)布了Isaac Perceptor軟件開發(fā)工具包,該工具包具有最先進的多攝像頭視覺里程計、3D重建和占用地圖,以及深度感知功能;以及為了使機械臂更具適應(yīng)性,宣布推出Isaac Manipulator,一個先進的機械臂感知、路徑規(guī)劃和運動學控制庫。

          自動駕駛未來可期

          根據(jù)Frost&Sullivan統(tǒng)計數(shù)據(jù)顯示,2022年英偉達出貨量占到全球高算力自動駕駛芯片市場份額為82.5%。按照黃仁勛的規(guī)劃,未來汽車業(yè)務(wù)將與數(shù)據(jù)中心、游戲并列成為英偉達的三大支柱業(yè)務(wù)。

          最新發(fā)布的集中式車載計算平臺DRIVE Thor也將搭載全新Blackwell架構(gòu)。多家頭部電動汽車制造商在GTC上展示了其搭載DRIVE Thor的下一代AI車型,既包括比亞迪、廣汽埃安、小鵬、理想汽車和極氪等眾多中國車企,也包括了文遠知行等自動駕駛平臺公司。

          推理微服務(wù)成為AI入口

          隨著人工智能技術(shù)加速在各領(lǐng)域的滲透和變革,除了硬件產(chǎn)品,英偉達還與大量與企業(yè)合作,推進AI落地。為此,英偉達推出了推理微服務(wù),即NVIDIA NIM,能夠?qū)㈤_發(fā)者與數(shù)億個GPU連接起來,以部署各種定制AI。這是一種全新的軟件打包和交付方式,該服務(wù)有望支撐英偉達未來在AI服務(wù)上的營收增長。

          其具體模式為:英偉達提供預訓練好的AI模型并開放API(應(yīng)用程序接口),再由行業(yè)客戶開發(fā)應(yīng)用,以簡化企業(yè)自己開發(fā)生成式AI應(yīng)用的成本。

          640.png

          這些微服務(wù)支持行業(yè)標準API、易于連接,可在英偉達龐大的CUDA安裝基礎(chǔ)上工作,針對新GPU進行重新優(yōu)化,并不斷掃描安全漏洞和威脅。黃仁勛也在現(xiàn)場示范了英偉達內(nèi)部藉NIM所打造的“芯片設(shè)計聊天機器人”,經(jīng)過數(shù)據(jù)訓練和模型微調(diào)后,聊天機器人即可給出符合芯片設(shè)計領(lǐng)域的答案,甚至能同步生成所需的程序代碼。

          企業(yè)IT行業(yè)正坐在一座「金礦」上,擁有多年來創(chuàng)建的所有這些令人驚嘆的工具和數(shù)據(jù),如果能把它們變成AI助手,就能提供更多可能。

          · 在量子計算領(lǐng)域,英偉達宣布推出云量子計算機模擬微服務(wù),幫助研究人員和開發(fā)人員在化學、生物學、材料科學等科學領(lǐng)域的量子計算研究,該服務(wù)基于開源CUDA-Q量子計算平臺,支持用戶在云端構(gòu)建并測試新的量子算法和應(yīng)用,包括支持量子-經(jīng)典混合算法編程的模擬器和工具等。與其他云服務(wù)不同,英偉達目前還沒有量子計算機,但未來它將提供第三方量子計算機的訪問。

          · 在醫(yī)藥領(lǐng)域,英偉達宣布旗下包括Parabricks、MONAI、NeMo?、Riva、Metropolis,現(xiàn)已通CUDA-X微服務(wù)提供訪問,以加速藥物研發(fā)、醫(yī)學影像、基因組學分析等醫(yī)療工作流程。

          游戲領(lǐng)域大顯身手

          游戲起家的英偉達,自然也沒有忘記人工智能技術(shù)在游戲領(lǐng)域大顯身手,這次GTC上重點展示的是它的數(shù)字人技術(shù)。英偉達數(shù)字人平臺包括三項主要技術(shù):NVIDIA ACE、NVIDIA NeMo和RTX光線追蹤技術(shù),分別通過AI驅(qū)動游戲角色語言、語音、動畫和圖形。

          其中,NVIDIA ACE可幫助開發(fā)者通過Audio2Face驅(qū)動的面部動畫以及由Riva自動語音識別(ASR)和文本轉(zhuǎn)語音(TTS)驅(qū)動的語音交流,允許模型在云端和PC上運行,以確保用戶獲得最佳體驗。全球游戲發(fā)行商正評估NVIDIA ACE如何改善游戲體驗。

          NVIDIA NeMo則可幫助開發(fā)者提供企業(yè)級生成式AI模型,包括精確數(shù)據(jù)管理、模型個性化定制、檢索增強生成和加速性能等。最后,包含RTX全局光照(RTXGI)和DLSS 3.5等渲染技術(shù)的集合,可在游戲和應(yīng)用中實現(xiàn)實時光線路徑追蹤。

          總結(jié)

          自從2022年底OpenAI宣布AI聊天機器人ChatGPT以來,全球掀起了一輪巨大的AI熱潮,推動了GPU芯片大廠英偉達數(shù)個財務(wù)季度的收入爆發(fā)式增長。更加確切地說是,英偉達在最近幾個財季的收入暴增,其實主要依賴數(shù)據(jù)中心業(yè)務(wù)作為增長引擎。與此同時,英偉達在資本市場上還受到投資者們狂熱地追捧,它的股價持續(xù)攀升。目前,英偉達已經(jīng)擁有2.26萬億美元的市值,是全球市值排名第三的上市企業(yè),僅次于微軟的3.16萬億美元和蘋果的2.76萬億美元。

          640-2.jpeg

          預計每年全球?qū)?shù)據(jù)中心設(shè)備投入的費用將共計2500億美元,英偉達產(chǎn)品在其中占據(jù)的份額將超過其他芯片生產(chǎn)商。英偉達正致力提供AI模型和其他軟件,然后根據(jù)客戶的算力和運行的芯片數(shù)量向客戶收費,軟件業(yè)務(wù)未來有望帶來數(shù)十億美元營收,成為高利潤率業(yè)務(wù)。

          Blackwell產(chǎn)品線就由Nvidia AI Enterprise支持。英偉達的軟件和生態(tài)系統(tǒng)有助于加速AI的應(yīng)用,同時進一步構(gòu)建“護城河”,構(gòu)建了難以跨越的競爭壁壘。憑借領(lǐng)先GPU/DPU/CPU、硬件/軟件平臺和強大的生態(tài)系統(tǒng),英偉達有望繼續(xù)從人工智能、高性能計算、游戲和自動駕駛汽車的重大長期趨勢中受益。



          關(guān)鍵詞: 英偉達 Blackwell 芯片 GPU AI

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉