晶圓級芯片迎來重磅玩家,未來可期
在剛剛結(jié)束的國際消費(fèi)類電子產(chǎn)品展覽會(huì)(CES2025)上,英偉達(dá) CEO 黃仁勛的主題演講引發(fā)了技術(shù)界的熱議,其展示了晶圓級芯片概念 Grace Blackwell NVLink72,并號稱是世界上最大的芯片。
本文引用地址:http://cafeforensic.com/article/202501/466468.htm黃仁勛在演講中稱,英偉達(dá)擁有多種計(jì)算網(wǎng)絡(luò)系統(tǒng),例如 NVLink 36 和 NVLink 72,能夠滿足全球幾乎所有數(shù)據(jù)中心的需求,目前在約 45 家工廠生產(chǎn)。公司的目標(biāo)是創(chuàng)建一個(gè)名為 Grace Blackwell NVLink72 的巨型芯片,該芯片將使用 72 個(gè) Blackwell GPU,性能超越世界上最快的超級計(jì)算機(jī)。
圖源:NVIDIA 官網(wǎng)
Grace Blackwell NVLink72 具備將 1.5 噸重,2 英里長銅纜鏈接的 NVL72 濃縮于晶圓上的潛力,以進(jìn)一步提升內(nèi)存帶寬和芯片間互聯(lián)傳輸速度。
值得注意的是,這款巨型芯片是一塊晶圓級別大小的芯片,相當(dāng)于 36 張 GB200 組合在一起,總共可提供 1.4EFLOPS 算力,實(shí)現(xiàn) 1.2PB/s 的帶寬吞吐。那么英偉達(dá)此次推出的晶圓級芯片采取的是一種什么樣的技術(shù)呢?為什么如此強(qiáng)大?
什么是晶圓級芯片?
在全球大模型火熱與摩爾定律變緩的雙重背景下,傳統(tǒng)芯片制造工藝逐漸接近物理極限,嚴(yán)重制約了算力的提升空間。面對這一挑戰(zhàn),開發(fā)晶圓級芯片成為了一個(gè)備受關(guān)注的解決方案。
顧名思義,晶圓級芯片通過制造一塊不進(jìn)行切割的晶圓級互連基板,再將設(shè)計(jì)好的常規(guī)裸片在晶圓基板上進(jìn)行集成與封裝,從而獲得一整塊巨大的芯片。對比傳統(tǒng)芯片構(gòu)成的計(jì)算集群,晶圓級計(jì)算系統(tǒng)通過先進(jìn)集成技術(shù)獲得了芯片級的互連能力。由于舍棄了原本的芯片切割、封裝、互連、電纜及光纜連接等步驟,利用晶圓級的技術(shù)物理實(shí)現(xiàn),充分發(fā)揮了晶圓大規(guī)模、高密度和低損耗的特點(diǎn)。
晶圓級芯片通過構(gòu)建整片晶圓規(guī)模的大規(guī)模集成電路,打破了傳統(tǒng)芯片設(shè)計(jì)中由光刻口徑施加的面積墻限制,對比等效的算力集群,能夠顯著提高系統(tǒng)集成度,減少互連延遲和功耗。相比于傳統(tǒng)的芯片,未經(jīng)切割的晶圓上電路單元可以更緊密地排列,形成帶寬更高、延時(shí)更短的互連結(jié)構(gòu),大幅加速數(shù)據(jù)傳輸。晶圓級芯片可以說是目前為止算力節(jié)點(diǎn)集成密度最高的一種形態(tài)。據(jù)測算,其單機(jī)柜算力密度能夠達(dá)到現(xiàn)有 GPU 方案的 200 倍以上。
那么晶圓級芯片和常規(guī)芯片的生產(chǎn)流程有哪些區(qū)別呢?
在常規(guī)芯片生產(chǎn)流程中,一個(gè)晶圓在光刻后被切割成許多小裸片(Die)并單獨(dú)進(jìn)行封裝,每片裸片都單獨(dú)封裝為一顆完整的芯片。而晶圓級芯片則是通過制造一塊不進(jìn)行切割的晶圓級互連基板,再將設(shè)計(jì)好的常規(guī)裸片在晶圓基板上進(jìn)行集成與封裝,從而獲得一整塊巨大的芯片。對比傳統(tǒng)芯片構(gòu)成的計(jì)算集群,晶圓級計(jì)算系統(tǒng)通過先進(jìn)集成技術(shù)獲得了芯片級的互連能力。在晶圓級芯片中,晶圓與附帶組件(例如電源模組和冷卻模組)組成一個(gè)完整的系統(tǒng),而不僅僅是單個(gè)芯片。
去年臺積電公布了其晶圓級計(jì)算(集成)技術(shù)的突破性進(jìn)展和量產(chǎn)計(jì)劃。目前預(yù)計(jì) SoW(System on Wafer,即晶圓上系統(tǒng))會(huì)極大改變計(jì)算系統(tǒng)的發(fā)展進(jìn)程,為大模型和未來的超級計(jì)算更大的算力支撐和擴(kuò)展能力。SoW 的量產(chǎn)預(yù)告也意味著工業(yè)界已經(jīng)在緊鑼密鼓的籌備超越傳統(tǒng) GPGPU 架構(gòu)的新計(jì)算范式。
在晶圓上系統(tǒng)集成工藝的研發(fā)取得突破性進(jìn)展后,臺積電確信,晶圓級設(shè)計(jì)的使用率不僅會(huì)大幅提升,而且人工智能和 HPC 等大趨勢將需要更復(fù)雜的解決方案:垂直堆疊的晶圓系統(tǒng)設(shè)計(jì)。
英偉達(dá)押注!AI 計(jì)算正向 SoW 發(fā)展
國際上對晶圓上系統(tǒng)的研究起步比較早,2020 年,臺積電發(fā)布的 InFO_SoW 技術(shù)成功應(yīng)用于特斯拉的 Dojo 系統(tǒng)。2022 年,ASE、AMD、Intel、微軟、高通、三星、臺積電等十大行業(yè)巨頭宣布成立行業(yè)聯(lián)盟,并制定發(fā)布了通用小芯?;ミB通道標(biāo)準(zhǔn)規(guī)范 UCIe。
晶圓級設(shè)計(jì)通過直接在整片硅晶圓上構(gòu)建處理器,實(shí)現(xiàn)了前所未有的核心間通信速度、性能密度以及能效,然而,其復(fù)雜度與成本也相應(yīng)增加,限制了廣泛應(yīng)用。受限于技術(shù)水平,目前只有 Cerebras、特斯拉和英偉達(dá)開發(fā)了晶圓級芯片。
Cerebras
Cerebras 成立于 2016 年,是一家位于美國硅谷的 AI 芯片制造商。其聯(lián)合創(chuàng)始人及首席執(zhí)行官是安德魯·費(fèi)爾德曼。2019 年,Cerebras 就發(fā)布了第一代 WSE(Wafer Scale Engine)芯片。至今該公司已經(jīng)推出第三代晶圓級芯片。
2024 年 3 月 14 日,美國加州半導(dǎo)體公司 Cerebras Systems 宣布第三代晶圓級 AI 加速芯片「WSE-3」正式面世。這款被業(yè)內(nèi)譽(yù)為「規(guī)格參數(shù)瘋狂」的芯片不僅在功耗和價(jià)格方面保持了穩(wěn)定的優(yōu)勢,更是將性能推向了一個(gè)新的高度。
圖源:Cerebras 官網(wǎng)
Cerebras 公司的技術(shù)路線是通過修改芯片光刻流程實(shí)現(xiàn)的。晶圓光刻過程中在計(jì)算 Die 之間加入連接線,讓 Die 與 Die 互連進(jìn)而形成整個(gè)晶圓級芯片。
WSE-3 在工藝上采用了臺積電 5nm 工藝,晶體管數(shù)量達(dá)到了驚人的 4 萬億個(gè),AI 核心數(shù)量也進(jìn)一步增加至 90 萬個(gè)。緩存容量更是提升到了 44GB,為用戶提供了更加廣闊的數(shù)據(jù)處理空間。在外部搭配內(nèi)存方面,用戶還可以靈活選擇 1.5TB、12TB、甚至高達(dá) 1200TB 的內(nèi)存容量,以滿足不同規(guī)模的應(yīng)用需求。盡管在核心數(shù)量和緩存容量的增加幅度上并不突出,但 WSE-3 的性能表現(xiàn)卻實(shí)現(xiàn)了質(zhì)的飛躍。其峰值 AI 算力高達(dá) 125PFlops,相當(dāng)于每秒能夠完成 12.5 億億次的浮點(diǎn)計(jì)算。WSE-3 在短短的一天內(nèi)就能夠完成 Llama 700 億參數(shù)的訓(xùn)練任務(wù)。
特斯拉
特斯拉在 2021 年一場名為「AI Day」的活動(dòng)上,推出了名為「Dojo」的超級計(jì)算機(jī),其功能不僅可以處理海量的視頻數(shù)據(jù),也可以為特斯拉 Autopilot、全自動(dòng)駕駛系統(tǒng)(FSD)以及人形機(jī)器人 Optimus 提供算力支持。
而 Dojo 超級計(jì)算機(jī)系統(tǒng)的核心部件就是 D1 芯片,這是一款采用臺積電 7 納米工藝打造的高性能芯片,集成了 500 億晶體管,其內(nèi)部集成了一個(gè)處理器核心、一個(gè)高帶寬內(nèi)存、一個(gè)高速互連器以及高速緩存,其峰值算力為 362TFL。
值得注意的是,Tesla Dojo 的晶圓級處理器采用了 Chiplet 路線在晶圓尺寸的基板上集成了 25 顆專有的 D1 芯片。這款晶圓級處理器也是基于臺積電 InFO-SoW 技術(shù)量產(chǎn)的首款解決方案,與系統(tǒng)級封裝 (SiP) 相比,具有低延遲高帶寬、高性能、高帶寬密度、供電電阻也更低。
特斯拉在一個(gè)訓(xùn)練模塊中集成了 25 顆 D1 芯片,讓特斯拉的訓(xùn)練模塊峰值算力達(dá)到了 9PFLOPS,帶寬為 900GB/s。然后 10 個(gè)訓(xùn)練模塊又繼續(xù)組合成一個(gè)算力為 900 PFLOPS,帶寬 90TB/s 的系統(tǒng)托盤,并配以相對應(yīng)的供電冷卻聯(lián)網(wǎng)系統(tǒng),這個(gè)東西被官方稱為 ExaPOD 集群。在經(jīng)過了一系列的「堆料」操作后,特斯拉就得到了這個(gè)由 3000 顆 D1 芯片組成的 Dojo 超級計(jì)算機(jī)。
英偉達(dá)
在近期的 CES 上,英偉達(dá)推出了其歷史上造過的最大芯片 Grace Blackwell NVLink 72。該芯片主要用于 GB200 NVL72(NVIDIA 于 2024 年 3 月 GTC 大會(huì)上發(fā)布的一套多節(jié)點(diǎn)液冷機(jī)架級擴(kuò)展系統(tǒng),適用于高度計(jì)算密集型的工作負(fù)載)中。
圖源:NVIDIA 官網(wǎng)
GB200 NVL72 在一個(gè)機(jī)柜中,封裝了 36 個(gè) Grace CPU 和 72 個(gè) Blackwell GPU,AI 算力高達(dá) 1.44 EFLOPS。而此前特斯拉自研的 Dojo 將 5 x 5 的 D1 芯片封裝成訓(xùn)練塊,再將多個(gè)訓(xùn)練塊封成一個(gè)機(jī)柜,這個(gè)機(jī)柜叫 ExaPod。
英偉達(dá)的 Grace Blackwell NVLink 72 對特斯拉的自研芯片構(gòu)成了巨大挑戰(zhàn)。根據(jù)特斯拉方面的計(jì)劃,他們本來打算在 2023 年財(cái)年生產(chǎn) 4~5 萬顆 D1 芯片,逐步替換掉英偉達(dá)的算力芯片,其首個(gè) ExaPOD 也在 2023 年 7 月投入了運(yùn)營。
但此后馬斯克突然表示,自研芯片,毫無必要,他說:「如果英偉達(dá)能夠給我們足夠的 GPU,也許我們就不需要 Dojo,但他們無法滿足我們的需求?!挂幌虬V迷于技術(shù)創(chuàng)新的馬斯克之所以會(huì)說這樣的話,無非就是他們的自研芯片無法滿足需求。
隨著臺積電工藝的成熟,AI 計(jì)算正向 SoW 發(fā)展,未來會(huì)有越來越多企業(yè)加入戰(zhàn)局。
軟件定義晶上系統(tǒng)(SDSoW)受關(guān)注
現(xiàn)階段,晶上系統(tǒng)(SoW)正以其獨(dú)特的魅力引領(lǐng)著全球集成電路產(chǎn)業(yè)的變革。早在 2019 年,鄔江興院士團(tuán)隊(duì)就憑借極具前瞻性的眼光原創(chuàng)提出軟件定義晶上系統(tǒng)(Software Defined System on Wafer,簡稱 SDSoW)概念。SDSoW 是直接用完整的晶圓基板來做系統(tǒng)內(nèi)部各模塊的互連底座,通過在晶圓上采用先進(jìn)集成技術(shù)將計(jì)算、存儲、互連、I/O 等各種芯粒組裝實(shí)現(xiàn)完整的系統(tǒng),提供更大范圍的資源可配置性,同時(shí)系統(tǒng)內(nèi)各模塊之間以及各模塊本身的連接支持軟件定義。它打破現(xiàn)有集成電路的設(shè)計(jì)方法、計(jì)算范式、實(shí)現(xiàn)材料、集成方式等邊界條件,相比基于 PCB 的芯片焊裝成組件堆疊出更大系統(tǒng)的工程實(shí)現(xiàn)模式,SDSoW 系統(tǒng)的帶寬、延遲、功耗均可獲得大幅增益,整體系統(tǒng)性能可提升 3~5 個(gè)數(shù)量級。
SDSoW 技術(shù)是應(yīng)對芯片傳統(tǒng)工藝微縮難以為繼、摩爾定律逐漸失效的新出路,通過晶上拼裝集成和軟件定義體系結(jié)構(gòu),不僅可以滿足系統(tǒng)技術(shù)創(chuàng)新對于領(lǐng)域?qū)S枚鄻踊?、異質(zhì)集成功能等方面的需求,而且還擺脫了單一工藝節(jié)點(diǎn)維度對提升芯片性能的束縛,通過芯粒的晶圓級組裝,可以快速、經(jīng)濟(jì)地研制出能夠滿足未來需求的晶圓級芯片及系統(tǒng)。SDSoW 將帶動(dòng)集成電路技術(shù)從 SoC 進(jìn)入 SoW 時(shí)代, 極大地弱化我國集成電路對先進(jìn)工藝進(jìn)步的強(qiáng)依賴性,助力我國奪取美國霸權(quán)下的集成電路自主發(fā)展權(quán)。
為加快培育我國晶上系統(tǒng)產(chǎn)業(yè)生態(tài)體系,軟件定義晶上系統(tǒng)技術(shù)與產(chǎn)業(yè)聯(lián)盟(簡稱晶上聯(lián)盟)積極開展生態(tài)服務(wù)平臺建設(shè),已取得一系列突出成果。2024 年 6 月,在第七屆晶上系統(tǒng)生態(tài)大會(huì)(SDSoW2024)上成立了天津市晶上集成電路產(chǎn)業(yè)發(fā)展中心以及晶上聯(lián)盟專家委員會(huì),以指導(dǎo)、推動(dòng)國內(nèi)晶上系統(tǒng)技術(shù)的發(fā)展。同時(shí),大會(huì)還發(fā)布了《晶上系統(tǒng)硬件制造通用工程技術(shù)規(guī)范》和《軟件定義晶上系統(tǒng)互連接口標(biāo)準(zhǔn)(草案)》,為晶上系統(tǒng)的設(shè)計(jì)和制造提供了明確的指導(dǎo)和規(guī)范。據(jù)了解,2025 年第八屆晶上大會(huì)還將會(huì)有更多生態(tài)成果重磅發(fā)布。
評論