色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<button id="4sqye"></button>

<samp id="4sqye"></samp>

<dl id="4sqye"><tbody id="4sqye"></tbody></dl>

"); //-->

博客專欄

EEPW首頁(yè) > 博客 > 誰(shuí)能卡住英偉達(dá)的脖子？

誰(shuí)能卡住英偉達(dá)的脖子？

發(fā)布人：晴朗雨時(shí)間：2023-06-30 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

發(fā)布文章

生成式AI的風(fēng)口下，一些行業(yè)正在“悶聲發(fā)大財(cái)”。

從今年2月開始，中國(guó)臺(tái)灣廠商AVC和雙鴻(AURAS)股價(jià)一路飆升，在端午假期前的最后一個(gè)交易日，兩家公司的股價(jià)較4個(gè)月前均實(shí)現(xiàn)翻倍，分別收?qǐng)?bào)249.5新臺(tái)幣（約合58.1元人民幣）及292.5新臺(tái)幣（約合68.1人民幣）。

如果對(duì)照芯片巨頭英偉達(dá)(NVEDIA)近期股價(jià)****，會(huì)發(fā)現(xiàn)三者之間存在著驚人的一致性——這家芯片巨頭公司同樣在這4個(gè)月內(nèi)時(shí)間實(shí)現(xiàn)了股價(jià)翻倍。

這顯然不是巧合。

實(shí)際上，上述兩家位于中國(guó)臺(tái)灣地區(qū)的公司，或多或少與英偉達(dá)有關(guān)，確切地說(shuō)是與生成式AI相關(guān)。AVC是全球最大散熱模組廠商，也是英偉達(dá)AI服務(wù)器系統(tǒng)DGX H100目前的風(fēng)冷散熱系統(tǒng)供應(yīng)商，雙鴻則是Supermicro（超微電腦）服務(wù)器散熱系統(tǒng)的供應(yīng)商。

散熱，這個(gè)過(guò)去不被人們重點(diǎn)關(guān)注的產(chǎn)業(yè)，正由于AI帶來(lái)的數(shù)據(jù)量和計(jì)算量的爆發(fā)增長(zhǎng)逐漸從幕后走向臺(tái)前，多位從業(yè)人士向虎嗅表達(dá)了這樣一個(gè)觀點(diǎn)：“今明兩年，AI行業(yè)中可能會(huì)出現(xiàn)算力被散熱‘卡脖子’的情況?！?/p>

6月15日，在AMD發(fā)布APU（加速處理器）MI 300系列后，AMD股價(jià)由于受到“缺少大客戶”的質(zhì)疑下跌3.6%，但就在同一日，AVC與雙鴻的股價(jià)卻因AI芯片出現(xiàn)新玩家的利好應(yīng)聲上漲5.8%和3.6%。

作為一個(gè)與計(jì)算機(jī)科學(xué)共同成長(zhǎng)起來(lái)的產(chǎn)業(yè)，散熱模組廠商們經(jīng)歷了多次電子信息革命，但當(dāng)下AI的爆發(fā)，似乎才真正讓這個(gè)行業(yè)真實(shí)現(xiàn)了“翻身”。

AI的盡頭是散熱？

當(dāng)電流通過(guò)電阻時(shí)，所消耗的電能會(huì)全部轉(zhuǎn)化為熱能，這種現(xiàn)象被稱為電流的熱效應(yīng)，自計(jì)算機(jī)誕生以來(lái)，從業(yè)者們用盡辦法將電子器件的溫度控制在合理的范圍內(nèi)。

當(dāng)然，早期的計(jì)算機(jī)功耗較低，而且整機(jī)體積較大，因此不需要單獨(dú)設(shè)計(jì)系統(tǒng)級(jí)的散熱解決方案，通常做法就是在計(jì)算機(jī)背部放置個(gè)簡(jiǎn)易的風(fēng)扇，以將熱流導(dǎo)出。

1989年，英特爾發(fā)布了80486處理器，人類第一次實(shí)現(xiàn)了在微處理器中集成百萬(wàn)級(jí)晶體管，這枚芯片的功耗也水漲船高，在芯片出廠時(shí)，英特爾為其配備了一組鋁制的散熱片，再配合機(jī)箱上的風(fēng)扇完成整體散熱。

以今天的視角來(lái)看，這種方案還是很簡(jiǎn)陋，但它勾勒出了散熱設(shè)計(jì)最底層的原理：先導(dǎo)熱，再散熱。簡(jiǎn)單地來(lái)說(shuō)，導(dǎo)熱就是將熱量在介質(zhì)中傳送，散熱就是讓熱量盡可能快地從介質(zhì)向外界散發(fā)。

傳統(tǒng)的服務(wù)器散熱方案與計(jì)算機(jī)散熱原理大致相同，區(qū)別在于服務(wù)器所使用的算力芯片由于能耗較高，往往將芯片級(jí)散熱系統(tǒng)作為重點(diǎn)，通常來(lái)說(shuō)就是將芯片熱量通過(guò)熱管、均熱片等傳導(dǎo)到多褶結(jié)構(gòu)的散熱鰭片上，再通過(guò)風(fēng)扇進(jìn)行主動(dòng)散熱。

傳統(tǒng)服務(wù)器散熱器，與臺(tái)式機(jī)基本一致。圖片來(lái)源：中關(guān)村在線

不過(guò)，這種風(fēng)冷式散熱方案在當(dāng)前AI服務(wù)器上的表現(xiàn)已經(jīng)明顯力不從心。

原因在于高性能AI芯片的功耗在隨著算力同步大幅提升。10年前市面上能買到的最頂級(jí)的數(shù)據(jù)中心GPU是英偉達(dá)K40,其熱設(shè)計(jì)功耗(TDP)為235W，2020年英偉達(dá)發(fā)布A100時(shí)，熱設(shè)計(jì)功耗接近400W，到了最新的H100芯片，熱設(shè)計(jì)功耗直接飆升到700W。

國(guó)內(nèi)散熱技術(shù)廠商廣州力及熱管理科技(NeoGene Tech)創(chuàng)始人陳振賢向虎嗅表示，到了明年，單顆高性能AI芯片的熱設(shè)計(jì)功耗將會(huì)突破1000W。

那么風(fēng)冷式散熱對(duì)應(yīng)的散熱極限是多少？國(guó)金證券研究所的一份報(bào)告指出，服務(wù)器2U空間下，250W大約是風(fēng)冷的極限，4U以上空間風(fēng)冷可以解到400W-600W。

這里需要普及下“U”的概念，這是美國(guó)電子工業(yè)協(xié)會(huì)制訂的標(biāo)準(zhǔn)化尺寸，1U服務(wù)器的寬度為48.26厘米（19英寸），高度為4.445厘米（1.75英寸）。通常情況下，標(biāo)準(zhǔn)服務(wù)器機(jī)柜的高度為42U，但這并不意味可以容納42枚1U服務(wù)器，因?yàn)檫^(guò)大的密度會(huì)增加散熱負(fù)擔(dān)。

而如果使用英偉達(dá)H100芯片的話，在使用風(fēng)冷散熱模組方案的情況下，就需要用到4U的機(jī)柜。

因此，為了提高單一機(jī)柜的功率密度，數(shù)據(jù)中心近些年開始普遍使用液冷方案。其大致可以分為兩種技術(shù)路徑：冷板式(Cold Plate)與浸沒(méi)式(Immersion)，前者是通過(guò)冷板將發(fā)熱器件的熱量間接傳遞給封閉在循環(huán)管路中的冷卻液體，后者則直接將發(fā)熱器件以及電路板整體直接置于液體中。與空氣介質(zhì)相比，液體的導(dǎo)熱率更高、比熱容更大、吸熱能力也更強(qiáng)。

1U 2x雙路節(jié)點(diǎn)服務(wù)器的冷板式散熱方案，圖片來(lái)源：企業(yè)存儲(chǔ)技術(shù)

另外在運(yùn)營(yíng)成本上，液冷散熱也有較大的優(yōu)勢(shì)。傳統(tǒng)風(fēng)冷散熱將服務(wù)器芯片熱量吹到數(shù)據(jù)中心機(jī)房?jī)?nèi)，這要求機(jī)房空調(diào)溫度必須大幅降低，一位業(yè)內(nèi)人士向虎嗅透露，臺(tái)積電的數(shù)據(jù)中心溫度常年維持在零度左右。而液冷散熱模組的設(shè)備雖然較為昂貴，但大多屬于一次性成本，后續(xù)的能耗成本可以大幅降低。

但這并不意味著目前液冷散熱技術(shù)就是一種萬(wàn)全之策，陳振賢指出，在現(xiàn)有要求降低PUE（指數(shù)據(jù)中心消耗的所有能源與IT負(fù)載消耗的能源的比值）的限制下，既有的冷板式及浸沒(méi)式液冷技術(shù)也都紛紛面臨著解熱極限的問(wèn)題。

中科創(chuàng)星董事總經(jīng)理盧小保也向虎嗅表示，目前無(wú)論是風(fēng)冷還是液冷散熱方案，都進(jìn)入明顯的發(fā)展瓶頸期，未來(lái)熱管理相關(guān)技術(shù)可能會(huì)成為AI芯片性能釋放的決定性限制因素。

破局點(diǎn)在哪里？

盡管業(yè)內(nèi)目前還沒(méi)有出現(xiàn)公認(rèn)的“最佳解決方案”，但市場(chǎng)對(duì)于AI服務(wù)器的需求不會(huì)因此陷入停滯。

第三方研究機(jī)構(gòu)TrendForce發(fā)布的預(yù)測(cè)指出，2023年AI服務(wù)器（包含GPU、FPGA、ASIC等主芯片）出貨量將接近120萬(wàn)臺(tái)，同比去年增長(zhǎng)38.4%，而AI芯片今年出貨量將增長(zhǎng)46%。

有業(yè)內(nèi)人士向虎嗅表示，在今年的AI服務(wù)器市場(chǎng)中，英偉達(dá)A100與A800的出貨量將可能會(huì)占據(jù)80%，而隨著下半年數(shù)據(jù)中心陸續(xù)導(dǎo)入熱設(shè)計(jì)功耗高達(dá)700W的H100芯片后，行業(yè)內(nèi)既有的散熱技術(shù)可能都需要進(jìn)行一次“推倒重建”。

盧小保認(rèn)為，傳統(tǒng)的風(fēng)冷式散熱方案并不是完全沒(méi)有開發(fā)空間，但前提是導(dǎo)熱器件必須進(jìn)行升級(jí)換代，比如引入環(huán)路熱管技術(shù)。

目前芯片級(jí)風(fēng)冷散熱模組中，導(dǎo)熱器件主要以熱管為主，它的主體是一根封閉、中空的金屬管，內(nèi)部有少量工作介質(zhì)（主要是純水）的毛細(xì)結(jié)構(gòu)，運(yùn)行時(shí)依靠介質(zhì)蒸發(fā)吸收芯片熱量，再由風(fēng)扇將熱量吹走。

熱管工作原理，圖片來(lái)源：antpedia

而環(huán)路熱管在保留上述特性的同時(shí)，導(dǎo)熱能力增加幾倍，而且導(dǎo)熱距離更大，可以傳遞到一米以外甚至理論上可以傳導(dǎo)到十幾米以外，這是該技術(shù)在衛(wèi)星上已經(jīng)實(shí)現(xiàn)的效果。

“如果環(huán)路熱管能做到數(shù)米遠(yuǎn)，就意味著可以直接將服務(wù)器芯片的熱量導(dǎo)出到數(shù)據(jù)中心外部，連機(jī)房溫度的問(wèn)題都解決了”，盧小保指出。

不過(guò)作為一種航天工程的衍生技術(shù)，要在地面環(huán)境下落地應(yīng)用，技術(shù)難度極高，雖然學(xué)術(shù)界和工業(yè)界都有很多團(tuán)隊(duì)在從事這項(xiàng)技術(shù)的研發(fā)，但真正具備落地商用能力的極少。

同樣，液冷散熱方案也具備升級(jí)迭代的潛力。比如結(jié)合將冷板與浸沒(méi)式散熱的技術(shù)特點(diǎn)相結(jié)合，在傳統(tǒng)的1U或2U機(jī)柜槽中接入冷板，再接入浸沒(méi)散熱用的單向冷卻液，以實(shí)現(xiàn)雙重冷卻循環(huán)。

據(jù)外媒Electronics Weekly報(bào)道，前不久美國(guó)能源部(DOE)立項(xiàng)了一個(gè)名為COOLERCHIPS的研究計(jì)劃，?助英偉達(dá)5百萬(wàn)美元開發(fā)此項(xiàng)混合液冷技術(shù)，利用兩相冷卻液作為冷板的內(nèi)循環(huán)，非導(dǎo)電冷卻液體則是被直接注入服務(wù)器中做循環(huán)。

陳振賢表示，NeoGene Tech亦自主研發(fā)了一種更先進(jìn)的具有三重液冷循環(huán)之服務(wù)器裝置技術(shù)，將具備更高功率芯片的散熱及散熱能力，而且無(wú)需價(jià)格昂貴的兩相冷卻液作為循環(huán)，在運(yùn)營(yíng)成本上將更優(yōu)。

此外，NeoGene Tech還基于冷板式液冷技術(shù)開發(fā)了一種被稱為牛勁冷泵(NeoGene Liquid Cooler)液冷散熱器產(chǎn)品，整體高度已經(jīng)壓縮至24.5mm，可以滿足數(shù)據(jù)中心1U服務(wù)器機(jī)柜的超高密度布建需求。其最大特點(diǎn)是可通過(guò)內(nèi)部三維蒸氣腔的功能設(shè)計(jì)，根據(jù)芯片功率及功率密度做出解熱及散熱的功能調(diào)整。

陳振賢指出，1U的牛勁冷泵液冷散熱器已經(jīng)可以服務(wù)TDP超過(guò)1000W的高算力芯片。

1U規(guī)格的牛勁冷泵液冷散熱產(chǎn)品，圖片來(lái)源：NeoGene Tech

以上提到的技術(shù)方案，都是基于過(guò)去散熱模組的迭代，那么是否存在一種技術(shù)，可以直接在芯片上做文章？

在今年3月，NeoGene Tech曾公開了一個(gè)針對(duì)高功率芯片封裝的散熱方案：直接將裸芯片和牛勁冷泵液冷循環(huán)系統(tǒng)封裝在一起工作。

陳振賢向虎嗅表示，“在這個(gè)技術(shù)路徑下，散熱模組不再是芯片外部的獨(dú)立器件，它本身就是IC元件的一部分，可達(dá)到即插即用(Plug&Play)的目的”。

這項(xiàng)散熱封裝技術(shù)若再搭配具有三重液冷循環(huán)之服務(wù)器裝置技術(shù)，能夠?yàn)閿?shù)據(jù)中心省去所有的二級(jí)、三級(jí)散熱系統(tǒng)，只需將自我浸沒(méi)式服務(wù)器插入機(jī)柜內(nèi)，再接入水管及非導(dǎo)電冷卻液管就可以直接使用。當(dāng)然，該方案對(duì)先進(jìn)封裝工藝有一定的要求。

另一種直接在芯片上做散熱的技術(shù)，也與封裝工藝緊密結(jié)合，那就是Chiplet。

簡(jiǎn)單地來(lái)說(shuō)，就是將一個(gè)單顆SoC芯片的功能拆分成眾多小芯片，然后運(yùn)用先進(jìn)封裝技術(shù)重組成一個(gè)龐大復(fù)雜的系統(tǒng)。從芯片散熱的角度來(lái)說(shuō)，Chiplet不會(huì)使芯片整體功率降低，但在拆分后的表面積會(huì)增加，也就是說(shuō)同等熱設(shè)計(jì)功率下，單位面積內(nèi)熱流強(qiáng)度會(huì)降低。

從這里也可以看出一個(gè)趨勢(shì)，那就是在AI芯片算力與能耗大幅提升的背景下，芯片散熱問(wèn)題，或者說(shuō)熱管理問(wèn)題，已經(jīng)不再是一個(gè)獨(dú)立的學(xué)科，而是更加趨近于系統(tǒng)性工程，未來(lái)AI芯片的天花板，或許真的取決于散熱技術(shù)的發(fā)展水平。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達(dá) AI

相關(guān)推薦

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

大嘴業(yè)話-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

AI+機(jī)器視覺成趨勢(shì)，圖文詳解N大應(yīng)用場(chǎng)景

智能計(jì)算安森美 AI 機(jī)器視覺 | 2024-07-31

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統(tǒng)

智能計(jì)算 Meta AI | 2024-07-31

WTC-AI太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

釋說(shuō)芯語(yǔ)16：硬科技：構(gòu)建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

海聯(lián)達(dá)（Aigale）Ai-HD1 無(wú)線全高清套件拆解

zhuwei0710 | 2013-04-28

消息稱英偉達(dá) RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應(yīng)緊張

消費(fèi)電子英偉達(dá) GPU | 2024-07-29

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

CSR8670CSR8675智能語(yǔ)音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺(tái)電腦... 一臺(tái)來(lái)創(chuàng)建AI... 一臺(tái)來(lái)模擬AI... 一臺(tái)來(lái)運(yùn)行AI”

智能計(jì)算 AI | 2024-07-31

WTC-AI型太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

萬(wàn)家樂(lè)JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬(wàn)家樂(lè) | 2013-01-17

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機(jī)器人 | 2021-02-26

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專區(qū)

<button id="e4uqq"></button>

<abbr id="e4uqq"><strong id="e4uqq"></strong></abbr><input id="e4uqq"></input>

<dl id="e4uqq"></dl>

<abbr id="e4uqq"></abbr>

<center id="e4uqq"></center>