英特爾(INTC.US)推出新一代AI芯片Gaudi 3 采用臺積電5nm工藝
周二,英特爾(INTC.US)在其Intel Vision 2024產(chǎn)業(yè)創(chuàng)新大會上,面向客戶和合作伙伴作出了一系列重磅宣布。這些宣布包括推出全新的Gaudi 3人工智能加速器、全新的至強6品牌,以及包括開放、可擴展系統(tǒng)和下一代產(chǎn)品在內(nèi)的全棧解決方案,還有多項戰(zhàn)略合作。
本文引用地址:http://cafeforensic.com/article/202404/457362.htm據(jù)數(shù)據(jù)預(yù)測,到2030年,全球半導(dǎo)體市場規(guī)模將達到1萬億美元,人工智能將是主要的推動力。然而,截至2023年,僅有10%的企業(yè)成功將其AI生成內(nèi)容(AIGC)項目商業(yè)化。英特爾的最新解決方案旨在幫助企業(yè)克服推廣AI項目時遇到的挑戰(zhàn),加快AIGC的商業(yè)應(yīng)用。
英特爾現(xiàn)有的Gaudi 2在2022年5月推出,并于2023年7月正式進入中國市場。它以高性能、高效率和高性價比而著稱。該產(chǎn)品采用臺積電7nm工藝,具備24個可編程的Tenor張量核心、48MB的SRAM緩存、21個10萬兆內(nèi)部互連以太網(wǎng)接口、96GB的HBM2E高帶寬內(nèi)存等,能夠滿足大規(guī)模語言模型和生成式AI模型的計算需求。
新一代Gaudi 3專為AI訓(xùn)練和推理設(shè)計,采用了臺積電(TSM.US)5nm工藝,帶來了兩倍的FP8 AI算力和四倍的BF16 AI算力,以及更高的網(wǎng)絡(luò)和內(nèi)存帶寬。與NVIDIA H100相比,Gaudi 3在流行的大型語言模型(LLM)上具有更高的推理性能和更快的訓(xùn)練速度。
預(yù)計Gaudi 3將顯著縮短不同規(guī)模的Llama2模型和GPT-3模型的訓(xùn)練時間,并在Llama和Falcon等大型語言模型上提供出色的推理吞吐量和能效。Gaudi 3支持多種形式因素,包括與OAM兼容的夾層卡、通用基板和PCIe擴展卡,滿足各種應(yīng)用需求。
Gaudi 3還提供開放的、基于社區(qū)的軟件支持,并通過標準以太網(wǎng)網(wǎng)絡(luò)實現(xiàn)從單節(jié)點到超級集群的靈活擴展,以支持大規(guī)模的推理、微調(diào)和訓(xùn)練需求。
Gaudi 3的優(yōu)勢在于其高性能、經(jīng)濟實用、節(jié)能和快速部署能力,能夠有效滿足AI應(yīng)用在復(fù)雜性、成本效益、數(shù)據(jù)可靠性和合規(guī)性等方面的需求。該加速器預(yù)計將在2024年第二季度開始向OEM廠商出貨,包括戴爾、慧與、聯(lián)想和超威等品牌。
目前,英特爾Gaudi加速器已與NAVER、博世、IBM等眾多行業(yè)客戶和合作伙伴建立了合作關(guān)系。
此外,英特爾還宣布與Anyscale、DataStax等多家合作伙伴共同創(chuàng)建開放平臺,推動AI創(chuàng)新。該平臺旨在開發(fā)開放的、多供應(yīng)商支持的AIGC系統(tǒng),提供先進的部署便利性、性能和價值。
英特爾計劃利用至強處理器和Gaudi加速器,推出AIGC流水線的參考實現(xiàn),發(fā)布技術(shù)概念框架,并進一步加強Intel Tiber開發(fā)者云平臺基礎(chǔ)設(shè)施的功能,以助力企業(yè)在AI創(chuàng)新領(lǐng)域取得突破。
截至周二收盤,英特爾收漲0.92%,報38.33美元。
評論