色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > Nvidia 征服了最新的 AI 測試

Nvidia 征服了最新的 AI 測試

—— GPU 制造商在圖神經(jīng)網(wǎng)絡(luò)和 LLM 微調(diào)方面超越了新的 MLPerf 基準(zhǔn)測試

作者：Samuel K. Moore 時(shí)間：2024-06-26 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

多年來，英偉達(dá)在許多機(jī)器學(xué)習(xí)基準(zhǔn)測試中占據(jù)主導(dǎo)地位，現(xiàn)在它又多了兩個(gè)檔次。
MLPerf，有時(shí)被稱為“機(jī)器學(xué)習(xí)的奧林匹克”的人工智能基準(zhǔn)測試套件，已經(jīng)發(fā)布了一套新的訓(xùn)練測試，以幫助在競爭計(jì)算機(jī)系統(tǒng)之間進(jìn)行更多更好的同類比較。MLPerf 的一項(xiàng)新測試涉及對大型語言模型的微調(diào)，該過程采用現(xiàn)有的訓(xùn)練模型，并用專業(yè)知識對其進(jìn)行更多訓(xùn)練，使其適合特定目的。另一個(gè)是圖神經(jīng)網(wǎng)絡(luò)，一種機(jī)器學(xué)習(xí)，一些文獻(xiàn)數(shù)據(jù)庫背后的一種機(jī)器學(xué)習(xí)，金融系統(tǒng)中的欺詐檢測，以及社交網(wǎng)絡(luò)。
即使使用谷歌和英特爾的人工智能加速器的計(jì)算機(jī)增加和參與，由英偉達(dá)的Hopper架構(gòu)驅(qū)動(dòng)的系統(tǒng)再次主導(dǎo)了結(jié)果。一個(gè)包含 11,616 個(gè) Nvidia H100 GPU 的系統(tǒng)（迄今為止最大的集合）在九個(gè)基準(zhǔn)測試中名列前茅，其中五個(gè)（包括兩個(gè)新基準(zhǔn)測試）創(chuàng)下了記錄。
“如果你只是把硬件扔到這個(gè)問題上，你就不能肯定地要改進(jìn)?！狣AVE SALVATOR，英偉達(dá)
11,616-H100系統(tǒng)是“我們做過的最大系統(tǒng)”，英偉達(dá)加速計(jì)算產(chǎn)品總監(jiān)Dave Salvator說。它在不到 3.5 分鐘的時(shí)間內(nèi)就完成了 GPT-3 訓(xùn)練試驗(yàn)。相比之下，512 GPU 系統(tǒng)大約需要 51 分鐘。（請注意，GPT-3 任務(wù)不是完整的訓(xùn)練，可能需要數(shù)周時(shí)間并花費(fèi)數(shù)百萬美元。取而代之的是，計(jì)算機(jī)在完成之前在商定的點(diǎn)上對數(shù)據(jù)的代表性部分進(jìn)行訓(xùn)練。
與英偉達(dá)去年在 GPT-3 上最大的參賽者——一臺 3,584 臺 H100 計(jì)算機(jī)相比，3.5 分鐘的結(jié)果代表了 3.2 倍的改進(jìn)。你可能會(huì)從這些系統(tǒng)大小的差異中預(yù)料到這一點(diǎn)，但在人工智能計(jì)算中，情況并非總是如此，Salvator解釋說。“如果你只是把硬件扔到這個(gè)問題上，你就不能肯定地要改進(jìn)，”他說。
“我們基本上是線性擴(kuò)展的，”Salvator 說。他的意思是，兩倍的 GPU 會(huì)導(dǎo)致訓(xùn)練時(shí)間減半?！癧這]代表了我們工程團(tuán)隊(duì)的一項(xiàng)偉大成就，”他補(bǔ)充道。
競爭對手也越來越接近線性縮放。這一輪英特爾部署了一個(gè)使用 1,024 個(gè) GPU 的系統(tǒng)，該系統(tǒng)在 67 分鐘內(nèi)執(zhí)行了 GPT-3 任務(wù)，而計(jì)算機(jī)的大小僅為六個(gè)月前 224 分鐘的四分之一。谷歌最大的 GPT-3 條目使用了 12 倍的 TPU v5p 加速器作為其最小條目，執(zhí)行任務(wù)的速度是其 9 倍。
Salvator 說，線性擴(kuò)展對于即將擁有 100,000 個(gè)或更多 GPU 的“AI 工廠”尤為重要。他表示，預(yù)計(jì)今年將有一個(gè)這樣的數(shù)據(jù)中心上線，另一個(gè)使用英偉達(dá)的下一個(gè)架構(gòu)Blackwell的數(shù)據(jù)中心將在2025年啟動(dòng)。
英偉達(dá)的連勝勢頭仍在繼續(xù)
盡管使用與去年訓(xùn)練結(jié)果相同的架構(gòu) Hopper，Nvidia 仍繼續(xù)延長訓(xùn)練時(shí)間。這一切都?xì)w功于軟件的改進(jìn)，Salvator 說?！巴ǔ?，在新架構(gòu)發(fā)布后，我們會(huì)從軟件中獲得 2-2.5 倍的 [提升]，”他說。
對于 GPT-3 訓(xùn)練，Nvidia 比 2023 年 6 月的 MLPerf 基準(zhǔn)測試提高了 27%。Salvator說，在提升的背后有幾個(gè)軟件變化。例如，Nvidia 工程師通過修剪 8 位和 16 位數(shù)字之間不必要的轉(zhuǎn)換，并更好地確定神經(jīng)網(wǎng)絡(luò)的哪些層可以使用較低精度的數(shù)字格式，調(diào)整了 Hopper 對不太準(zhǔn)確的 8 位浮點(diǎn)運(yùn)算的使用。他們還找到了一種更智能的方法來調(diào)整每個(gè)芯片計(jì)算引擎的功率預(yù)算，并加快了GPU之間的通信速度，Salvator將其比作“在烤面包機(jī)中涂黃油”。
此外，該公司還實(shí)施了一項(xiàng)稱為“閃光關(guān)注”的計(jì)劃。閃速注意力是由Samba Nova創(chuàng)始人Chris Re在斯坦福大學(xué)實(shí)驗(yàn)室發(fā)明的，是一種通過最大限度地減少對內(nèi)存的寫入來加速Transformer網(wǎng)絡(luò)的算法。當(dāng)它首次出現(xiàn)在 MLPerf 基準(zhǔn)測試中時(shí)，閃光注意力比訓(xùn)練時(shí)間縮短了 10%。（英特爾也使用了 flash attention 的一個(gè)版本，但不是 GPT-3。相反，它將該算法用于其中一個(gè)新基準(zhǔn)測試，即微調(diào)。
與 2023 年 11 月提交的相比，使用其他軟件和網(wǎng)絡(luò)技巧，Nvidia 在文本到圖像測試 Stable Diffusion 中實(shí)現(xiàn)了 80% 的加速。
新基準(zhǔn)
MLPerf 添加了新的基準(zhǔn)并升級了舊的基準(zhǔn)，以保持與 AI 行業(yè)正在發(fā)生的事情相關(guān)。今年增加了微調(diào)和圖神經(jīng)網(wǎng)絡(luò)。
微調(diào)需要已經(jīng)訓(xùn)練過的 LLM，并將其專門用于特定領(lǐng)域。例如，英偉達(dá)（Nvidia）采用了一個(gè)經(jīng)過訓(xùn)練的430億參數(shù)模型，并在GPU制造商的設(shè)計(jì)文件和文檔上對其進(jìn)行了訓(xùn)練，以創(chuàng)建ChipNeMo，這是一種旨在提高其芯片設(shè)計(jì)人員生產(chǎn)力的AI。當(dāng)時(shí)，該公司的首席技術(shù)官比爾·達(dá)利（Bill Dally）表示，培訓(xùn)法學(xué)碩士就像給它提供文科教育，而微調(diào)就像把它送到研究生院。
MLPerf 基準(zhǔn)測試采用預(yù)訓(xùn)練的 Llama-2-70B 模型，并要求系統(tǒng)使用政府文檔數(shù)據(jù)集對其進(jìn)行微調(diào)，以生成更準(zhǔn)確的文檔摘要。
有幾種方法可以進(jìn)行微調(diào)。MLPerf 選擇了一種稱為低秩適應(yīng) （LoRA）的方法。據(jù)該組織稱，該方法最終只訓(xùn)練了 LLM 參數(shù)的一小部分，與其他方法相比，硬件負(fù)擔(dān)降低了 3 倍，內(nèi)存和存儲(chǔ)的使用量減少了 3 倍。
另一個(gè)新的基準(zhǔn)測試涉及圖神經(jīng)網(wǎng)絡(luò)（GNN）。這些是針對可以由一組非常大的互連節(jié)點(diǎn)表示的問題，例如社交網(wǎng)絡(luò)或推薦系統(tǒng)。與其他 AI 任務(wù)相比，GNN 需要計(jì)算機(jī)中節(jié)點(diǎn)之間的大量通信。
該基準(zhǔn)測試在一個(gè)數(shù)據(jù)庫上訓(xùn)練了 GNN，該數(shù)據(jù)庫顯示了學(xué)術(shù)作者、論文和機(jī)構(gòu)之間的關(guān)系——一個(gè)具有 5.47 億個(gè)節(jié)點(diǎn)和 58 億條邊的圖形。然后對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，以預(yù)測圖中每個(gè)節(jié)點(diǎn)的正確標(biāo)簽。
未來的戰(zhàn)斗
2025 年的訓(xùn)練輪可能會(huì)看到比較 AMD、英特爾和 Nvidia 的新加速器的正面交鋒。AMD 的 MI300 系列大約在六個(gè)月前推出，計(jì)劃于 2024 年底對 MI325x 進(jìn)行內(nèi)存增強(qiáng)升級，下一代 MI350 計(jì)劃于 2025 年推出。英特爾表示，今年晚些時(shí)候向計(jì)算機(jī)制造商推出的Gaudi 3將出現(xiàn)在MLPerf即將推出的推理基準(zhǔn)測試中。英特爾高管表示，新芯片有能力在訓(xùn)練LLM時(shí)擊敗H100。但勝利可能是短暫的，因?yàn)橛ミ_(dá)已經(jīng)推出了一種新的架構(gòu)Blackwell，該架構(gòu)計(jì)劃于今年晚些時(shí)候推出。

本文引用地址：http://cafeforensic.com/article/202406/460369.htm

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： GPU 神經(jīng)網(wǎng)絡(luò) LLM MLPerf 基準(zhǔn)測試 英偉達(dá)

評論

相關(guān)推薦

一種基于人工神經(jīng)網(wǎng)絡(luò)的遙感圖像去條帶方法

設(shè)計(jì)方案一種基于人工神經(jīng)網(wǎng)絡(luò) 遙感圖像條帶方法 | 2009-09-03

傳英偉達(dá)曾要求建立專用CoWoS產(chǎn)線，但是被臺積電拒絕

智能計(jì)算英偉達(dá) CoWoS 臺積電 | 2024-07-24

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

浪潮信息回應(yīng)與英偉達(dá)分銷中國特供B20芯片：消息不實(shí)

智能計(jì)算英偉達(dá) 浪潮 B20 | 2024-07-23

大嘴業(yè)話——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（1）

視頻英偉達(dá) 嵌入式 ARM 軟銀 | 2023-11-06

神經(jīng)網(wǎng)絡(luò)的研究熱點(diǎn)分析(ZT)

moran | 2008-07-27

基于神經(jīng)網(wǎng)絡(luò)的配料系統(tǒng)PID控制器

資源下載 PID PID控制器神經(jīng)網(wǎng)絡(luò) 配料系統(tǒng) | 2007-12-28

英偉達(dá)RTX 50系顯卡延期至2025年

英偉達(dá) 顯卡 AMD Intel CES | 2024-07-23

醫(yī)療電子平臺選擇:FPGA、ARM、X86、DSP還是GPU分析

設(shè)計(jì)方案 FPGA ARM DSP GPU X | 2015-08-13

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

消息稱英偉達(dá)曾向臺積電詢問建設(shè)廠外 CoWoS 先進(jìn)封裝專線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺積電 | 2024-07-23

一種基于人工神經(jīng)網(wǎng)絡(luò)的遙感圖像去條帶方法

sasa541867 | 2007-09-08

神經(jīng)網(wǎng)絡(luò)PID在電機(jī)調(diào)速中的應(yīng)用

資源下載 PID 神經(jīng)網(wǎng)絡(luò) 電機(jī)調(diào)速 | 2007-12-27

英偉達(dá)的挑戰(zhàn)者的來錢之道

智能計(jì)算英偉達(dá) 大模型 | 2024-07-23

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

三星通過英偉達(dá)測試內(nèi)幕：用在中國大陸產(chǎn)品

網(wǎng)絡(luò)與存儲(chǔ) 三星英偉達(dá) HBM3 | 2024-07-24

大嘴業(yè)話——英偉達(dá)宣布進(jìn)軍CPU市場

視頻英偉達(dá) AI CPU | 2023-11-10

冗余度TT-VGT機(jī)器人的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制

設(shè)計(jì)方案冗余 TT-VGT 機(jī)器人的神經(jīng)網(wǎng)絡(luò) 適應(yīng) 控制 | 2009-09-04

飛機(jī)剎車模糊神經(jīng)網(wǎng)絡(luò)DSP嵌入式控制系統(tǒng)

瘋癲龍 | 2008-07-14

焦?fàn)t集氣管壓力模糊神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)

設(shè)計(jì)方案焦?fàn)t 氣管壓力模糊神經(jīng)網(wǎng)絡(luò) 控制系統(tǒng) | 2009-09-04

消息稱英偉達(dá) RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應(yīng)緊張

消費(fèi)電子英偉達(dá) GPU | 2024-07-29

基于神經(jīng)網(wǎng)絡(luò)PID控制的柔性微機(jī)器人系統(tǒng)

資源下載 PID PID控制神經(jīng)網(wǎng)絡(luò) 機(jī)器人系統(tǒng) | 2007-12-28

arm 新手問題：用arm可以實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)算法對數(shù)據(jù)的實(shí)時(shí)處理么

jackwang | 2006-09-17

基于GPU的數(shù)字圖像并行處理研究

設(shè)計(jì)方案圖像處理算法并行流處理 GPU | 2015-08-13

大嘴業(yè)話：A12真的能改變競爭格局么？

視頻 ARM A12 GPU | 2013-06-21

在英偉達(dá)工作不容易？員工曝高壓高工時(shí)更甚臺積電

國際視野英偉達(dá) 臺積電 | 2024-07-24

一種基于人工神經(jīng)網(wǎng)絡(luò)的遙感圖像去條帶方法

sasa541867 | 2007-09-02

智能控制理論與方法

資源下載智能控制模糊控制神經(jīng)網(wǎng)絡(luò) | 2007-02-09

BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及在Matlab中的實(shí)現(xiàn)

資源下載 The MathWorks Matlab BP神經(jīng) 神經(jīng)網(wǎng)絡(luò) | 2007-12-30

大嘴業(yè)話——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（2）

視頻 AI 英偉達(dá) ARM | 2023-11-07

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)