色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<tr id="tdm6f"></tr>

<ins id="tdm6f"></ins>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 算力芯片，終局之戰(zhàn)？

算力芯片，終局之戰(zhàn)？

作者：焉知汽車時間：2024-01-02 來源：搜狐科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

今天這篇文章的時候，我內(nèi)心是焦慮的，甚至有點悲觀。

本文引用地址：http://cafeforensic.com/article/202401/454374.htm

中國的芯片界同仁，不可謂不努力：充滿艱難險阻的工作，數(shù)十年如一日的煎熬，直面國際巨頭的競爭。在芯片具體產(chǎn)品層面，別人有性能優(yōu)勢，我們有價格優(yōu)勢。不敢說能打個你來我往，但至少還有還手之力。

然而，在計算生態(tài)方面，我們則完全沒有招架之力。計算生態(tài)就像一只無形的手，抹去了我們僅有的一點可能的機(jī)會，阻擋著我們前進(jìn)的步伐，讓我們距離世界先進(jìn)越來越遠(yuǎn)。

更令人焦慮的是未來：一方面，計算生態(tài)的作用在不斷地加強(qiáng)；另一方面，不同領(lǐng)域不同處理器的計算生態(tài)有進(jìn)一步融合的趨勢，逐漸形成新的超級生態(tài)。兩相疊加，一旦超級生態(tài)逐步建立，后進(jìn)者再無翻身的可能。

未來5-10年，大算力芯片，將迎來終局之戰(zhàn)。

1 計算架構(gòu)的發(fā)展趨勢

1.1 計算架構(gòu)的發(fā)展階段

隨著算力需求越來越高，同構(gòu)CPU的業(yè)務(wù)場景越來越少，基于GPU或AI等DSA處理器的異構(gòu)計算已經(jīng)成為主流。從發(fā)展的角度看，隨著大模型等算力場景的持續(xù)挑戰(zhàn)，未來會進(jìn)一步從異構(gòu)計算走向異構(gòu)融合計算。

如果按照處理器類型的數(shù)量進(jìn)行分類，可以分為三個階段：

第一階段，單個處理器，即CPU同構(gòu)計算階段。
第二階段，兩個處理器，即CPU+GPU或CPU+其他專用加速處理器的異構(gòu)計算階段。
第三階段，三個或三個以上處理器，即多異構(gòu)或異構(gòu)融合計算階段。

行業(yè)在創(chuàng)新處理器的設(shè)計和實現(xiàn)方面進(jìn)行了很多探索，比如存算一體、重構(gòu)計算、類腦計算、量子計算等等。這些新型的計算架構(gòu)設(shè)計或?qū)崿F(xiàn)方法，從系統(tǒng)指令復(fù)雜度的視角，可以歸屬到DSA或ASIC的范疇。因此，這些創(chuàng)新，沒有跳脫異構(gòu)融合計算的大框架。

以我目前淺薄的認(rèn)識，個人覺得：異構(gòu)融合計算，將是計算架構(gòu)的終極形態(tài)。

1.2 CPU同構(gòu)，單個處理器，單個生態(tài)

雖然僅僅只有一個處理器，但其計算生態(tài)已經(jīng)是地獄級難度。

Intel x86架構(gòu)的優(yōu)勢，是在眾多處理器架構(gòu)的廝殺中逐步確立的。隨著x86的優(yōu)勢地位確立，基于x86架構(gòu)的軟件生態(tài)逐漸成熟，即便是Intel自己，也無法改變這一局面。

Intel的64位安騰（Itanium）處理器，是一個非常典型的失敗的案例。安騰是Intel于2001年推出的64位架構(gòu)的CPU處理器，Intel對之寄予厚望。雖然是Intel的親兒子，雖然是功能強(qiáng)大的64位CPU架構(gòu)，雖然安騰的架構(gòu)和微架構(gòu)設(shè)計非常優(yōu)秀，但因為和x86的不兼容，完全一個新的生態(tài)，不可避免的走向了失?。?021年7月29日是安騰處理器最后的出貨日期，英特爾正式告別了這款使用IA-64指令集的純64位處理器）。

與此形成鮮明對比的，是AMD64的成功。2003年，AMD推出了業(yè)界首款 64 位處理器 Athlon 64，帶來了AMD64（x86-64）指令集，即x86指令集的64位擴(kuò)展超集，具備向下兼容的特點。因為向下兼容，繼承性地往前發(fā)展，最終成就了AMD64的成功。

1.3 GPU異構(gòu)，兩個處理器，兩個生態(tài)融合

相對于Intel的x86 CPU計算生態(tài)是百家爭鳴的勝者，NVIDIA GPU的CUDA生態(tài)，則是數(shù)年孤獨后的一鳴驚人。

在NVIDIA GPGPU之前，GPU真的就只是GPU，即專用于圖形計算的加速卡。這一時期的GPU，符合DSA的定義規(guī)范，可以當(dāng)作是專用于圖像領(lǐng)域的G-DSA。直到NVIDIA GPGPU的出現(xiàn)。

2006年，NVIDIA發(fā)布GPGPU。NVIDIA發(fā)現(xiàn)，圖像處理有很多并行處理的部件，于是決定將這些專用的處理完全改造成通用的高效能小CPU核，于是GPGPU誕生了。雖然此時，GPGPU已經(jīng)足夠通用，但其編程難度很高，于是NVIDIA又貼心地開發(fā)了CUDA計算框架。即便如此，早期的CUDA功能并不強(qiáng)大，開發(fā)仍然不夠友好。很多開發(fā)者并不看好，認(rèn)為CPU多核才是正確的發(fā)展道路。

直到2012年，Alexnet的問世，深度學(xué)習(xí)時代的來臨，NVIDIA GPU+CUDA才成了熱門的計算平臺，助推著NVIDIA市值超越一眾競爭對手，成為全球市值第一的芯片公司。再緊接著，2018年，AI大模型逐漸流行。進(jìn)一步把這股浪潮推向高潮，NVIDIA GPU一時間“洛陽紙貴”，同時，NVIDIA的市值突破了萬億美金大關(guān)。

我們再來看CPU和GPU的融合。

2022年初，NVIDIA正式宣布，收購ARM失敗。假如，NVIDIA收購ARM成功，這場大算力芯片的“戰(zhàn)爭”，基本上可以提前給出結(jié)果：NVIDIA獲勝，其他家永無出頭之日。好在這件事情沒有成行，算力芯片“戰(zhàn)爭”的結(jié)果，仍存在變數(shù)，這場“戰(zhàn)爭”仍在繼續(xù)。

之后，NVIDIA退而求其次，與ARM的深度合作，開發(fā)了Grace系列高性能CPU，以及CPU+GPU整合的Grace Hopper系列超級芯片。

2 計算生態(tài)的極端重要性

在之前，我一直以為Transformer之所以能夠脫穎而出的最大原因就是那篇論文的標(biāo)題：“Attention is all you need”，優(yōu)勢來源于算法本身。最近一段時間，跟好幾位AI領(lǐng)域的專家交流下來，他們的觀點是：有很大一部分原因是因為，Transformer比較好的實現(xiàn)了并行處理，能夠最大限度的利用GPU并行的算力，因此才能夠?qū)崿F(xiàn)更大參數(shù)規(guī)模的大模型，進(jìn)而獲得更好的智能體驗。

這個案例可以得到這樣一個結(jié)論：只有NVIDIA GPU+CUDA生態(tài)親和的模型才能最終走出來；如果不是NVIDIA GPU+CUDA架構(gòu)和生態(tài)友好的模型，哪怕實際效果再好，也受限于模型效率、參數(shù)規(guī)模和成本等方面的劣勢，無法脫穎而出。

或者說，大模型發(fā)展，強(qiáng)依賴于NVIDIA的GPU+CUDA計算生態(tài)。

在我的個人觀點里，一直以來，都是非常重視生態(tài)的難度和重要性的。但最近幾年，隨著認(rèn)識的進(jìn)一步加深，我的想法得到了進(jìn)一步修正。計算生態(tài)很重要，但過去10年左右的發(fā)展，使得計算生態(tài)的重要性，比我們大家想象的要更加重要：

一方面，業(yè)務(wù)快速發(fā)展迭代的壓力，使得大家更加依賴已有生態(tài)的持續(xù)優(yōu)化，而很難遷移到新的平臺和生態(tài)。
另一方面，計算從單機(jī)計算走向集群跨集群的分布式計算，計算生態(tài)的作用得到進(jìn)一步放大。一是不同計算節(jié)點工作任務(wù)之間的協(xié)同，二是計算任務(wù)在集群內(nèi)部不同計算節(jié)點之間可遷移，這些原因進(jìn)一步強(qiáng)化了計算生態(tài)的“強(qiáng)者更強(qiáng)，弱者更弱”。
還有一方面，隨著異構(gòu)計算和異構(gòu)融合計算的發(fā)展，處理器之間的協(xié)同效應(yīng)逐漸產(chǎn)生并進(jìn)一步增大。不同處理器的單個計算生態(tài)開始發(fā)生化學(xué)反應(yīng)，逐步會形成融合的超級生態(tài)。

我們定性分析一下：

芯片的難度很高，但生態(tài)的難度更高。
假設(shè)，在十幾年之前，2010年前后，芯片的重要性和難度是1，計算生態(tài)的重要性和難度則為10。
假設(shè)，隨著系統(tǒng)規(guī)模的增大，未來5-10年，也就是2030年前后，單個處理器芯片的重要性和難度可能上升到10。受業(yè)務(wù)迭代越來越快的影響，計算生態(tài)的重要性和難度需要再增加一個數(shù)量級，其值約為1,000。
在考慮集群/跨集群以及云網(wǎng)邊端融合成為主流計算方式的影響下，計算生態(tài)的重要性和難度再增加一個數(shù)量級，其值進(jìn)一步上升到10,000。
再隨著異構(gòu)的處理器越來越多，不同處理器計算生態(tài)的協(xié)同效應(yīng)凸顯，計算生態(tài)的重要性和計算難度再增加一個數(shù)量級，其值達(dá)到100,000。
最終，芯片和計算生態(tài)的重要性和難度比例變成10:100,000，或者是1:10,000。

3 算力芯片，終局之戰(zhàn)

3.1 多異構(gòu)融合，更多生態(tài)的融合

我們來分析一下Intel在多（超）異構(gòu)和未來異構(gòu)融合計算的布局：

首先是各類處理器。CPU生態(tài)，Intel首屈一指；GPU生態(tài)，Intel也有自己的產(chǎn)品，也在積極的布局；DSA類的生態(tài)，Intel有IPU和IPDK進(jìn)一步整合和增強(qiáng)。
然后是Intel在多異構(gòu)融合、跨平臺，完全可編程和開放生態(tài)方面都進(jìn)行了布局。Intel于2019年提出超異構(gòu)計算概念，隨后Intel布局了OneAPI框架、OpenVINO計算套件、IPDK計算框架，還發(fā)起了OPI開放計算聯(lián)盟等。目前，Intel的多異構(gòu)或異構(gòu)融合的芯片解決方案還沒有公開發(fā)布，拭目以待。

Intel目前面臨的挑戰(zhàn)是：上面列出的很多內(nèi)容，Intel提出之后，并沒有非常有競爭力的產(chǎn)品去承載。

（注：圖片為Altan結(jié)構(gòu)框圖，Thor和Altan一致）

NVIDIA在汽車CCU方面，已經(jīng)布局了Thor超級芯片，其核心計算部分由數(shù)據(jù)中心架構(gòu)的Grace CPU、Ampere GPU、Bluefield DPU組成。一方面算力強(qiáng)勁，把汽車變成了一臺超級計算機(jī)；另一方面，其架構(gòu)跟數(shù)據(jù)中心處理器架構(gòu)完全一致，為未來云邊端融合提供了堅實的物理基礎(chǔ)。

據(jù)說，NVIDIA在數(shù)據(jù)中心的CPU、GPU和DPU三芯片集成的、多種異構(gòu)融合計算架構(gòu)的超級芯片，已經(jīng)在研發(fā)中。

3.2 異構(gòu)融合，最后一場戰(zhàn)役

在GPU領(lǐng)域，NVIDIA構(gòu)建了牢不可破的CUDA計算生態(tài)；在DPU領(lǐng)域，NVIDIA擁有全球最好的DPU芯片，以及功能強(qiáng)大的DOCA計算框架；高性能網(wǎng)絡(luò)可以看做DPU的一個重要的功能子集，NVIDIA擁有全球最好的高性能網(wǎng)絡(luò)RDMA和獨一無二的Infiniband技術(shù)，高性能網(wǎng)絡(luò)是AI大模型訓(xùn)練集群的核心技術(shù)；在CPU領(lǐng)域，NVIDIA和ARM深度合作，搶占了比較有利的生態(tài)位。

一根筷子，輕輕地就會被折斷；十雙筷子，則牢牢地抱成一團(tuán)，幾乎牢不可破：

同構(gòu)計算的時代，面臨的僅僅是一個計算生態(tài)的挑戰(zhàn)；生態(tài)劣勢的廠家，仍然有翻盤的可能。
異構(gòu)計算的時代，面臨的則有兩個計算生態(tài)的挑戰(zhàn)，還有兩個處理器協(xié)同生態(tài)的挑戰(zhàn)；這個時候，生態(tài)劣勢的廠家，面對計算生態(tài)的無形之手，已經(jīng)有點力不從心。
異構(gòu)融合計算時代，計算平臺預(yù)計會多達(dá)5-10個處理器，面臨的不僅僅是5-10個計算生態(tài)的挑戰(zhàn)，更要面臨這些處理器組成的融合計算超級計算生態(tài)的挑戰(zhàn)；這個時候，會進(jìn)一步放大計算生態(tài)的“強(qiáng)者恒強(qiáng)，弱者恒弱”效應(yīng)，生態(tài)劣勢的廠家，不但無法翻盤，甚至連微小的一點市場份額都很難維持。

在未來5-10年，隨著生態(tài)的極端重要性進(jìn)一步凸顯，大算力芯片，即將迎來“終局之戰(zhàn)”。

4 唯一可能的破局之道：開放

回到現(xiàn)實，大算力芯片的計算生態(tài)之爭，“唯一可能”的破局之道：開放?！拔ㄒ弧笔钦f，有且僅有這一個辦法；“可能”指的是，這個方法雖然存在贏的幾率，但幾率很低很低。

4.1 異構(gòu)融合計算，架構(gòu)必須收斂

指令復(fù)雜度越高，單個處理器引擎覆蓋的場景就會越小，全場景覆蓋所需的引擎種類就會越多。從CPU到ASIC，處理器引擎越來越碎片化，構(gòu)建生態(tài)越來越困難。

異構(gòu)融合計算時代，集成的處理引擎類型和數(shù)量越來越多，處理引擎架構(gòu)越來越多，芯片平臺的數(shù)量也越來越多，所處的位置（云網(wǎng)邊端）也越來越豐富。

解決辦法只有一個：讓架構(gòu)收斂。每一個類型或子類型的處理器，全球全行業(yè)能夠形成標(biāo)準(zhǔn)的架構(gòu)和接口。

不確定的是，未來是走向封閉的一家通吃？還是行業(yè)形成共識，大家基于開放架構(gòu)做產(chǎn)品，行業(yè)走向基于產(chǎn)品競爭力的、真正的“公平”競爭？

4.2 除了最強(qiáng)者，開放是其他家的唯一選擇

只要你不是第一，第二名能做的也只能是開放。

開放陣營，不僅僅會包括行業(yè)里的二線、三線芯片公司，以及廣大的Startup公司，還會包括目前仍處于一線大廠的眾多知名公司。

從目前看可見的未來，NVIDIA會是最后贏者通吃最有優(yōu)勢的那個。那么，這個陣營包括Intel、AMD、高通、博通、Marvell等知名芯片公司，也包括互聯(lián)網(wǎng)巨頭等芯片的大客戶，如蘋果、谷歌、微軟、華為、阿里、騰訊等，也包括OpenAI等AI/AGI新貴。對抗巨頭的唯一做法，唯有凝聚共識，開源開放。

4.3 開放，讓大家回到同一起跑線

我們設(shè)想一個烏托邦的時代，在這個時代里：

CPU領(lǐng)域，已經(jīng)是形成共識的開放架構(gòu)成為主流，比如RISCv占據(jù)90%以上市場份額；
GPU領(lǐng)域，也出現(xiàn)了全行業(yè)形成共識的開放架構(gòu)和相應(yīng)的開源的開發(fā)框架；
AI、網(wǎng)絡(luò)、存儲等領(lǐng)域也是如此，均形成了各自開放的架構(gòu)和行業(yè)生態(tài)。
并且，進(jìn)一步的，行業(yè)形成了開源開放的統(tǒng)一的異構(gòu)融合計算框架。

那么，這個時候，大家會回到同一個起跑線：靠產(chǎn)品能力說話，而不是依靠無形的手——生態(tài)的力量。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 算力芯片

評論

相關(guān)推薦

國產(chǎn)算力龍頭，一年市值暴漲705億

智能計算算力芯片海光信息 | 2024-01-22

算力芯片，終局之戰(zhàn)？

智能計算算力芯片 | 2024-01-02

焦點

推薦視頻

技術(shù)專區(qū)

<acronym id="tznf6"></acronym>

<tr id="tznf6"></tr>