競爭加??!報(bào)道:亞馬遜勸說云客戶遠(yuǎn)離英偉達(dá),改用自家芯片
與其他云服務(wù)提供商一樣,亞馬遜租用給開發(fā)者和企業(yè)的服務(wù)器主要適用的是英偉達(dá)AI芯片。然而媒體報(bào)道,亞馬遜如今正試圖說服這些客戶轉(zhuǎn)而使用由亞馬遜自研AI芯片驅(qū)動(dòng)的服務(wù)器。
本文引用地址:http://cafeforensic.com/article/202412/465242.htmThe Information報(bào)道,亞馬遜芯片部門Annapurna的業(yè)務(wù)開發(fā)負(fù)責(zé)人Gadi Hutt表示,包括蘋果、Databricks、Adobe和Anthropic在內(nèi)的一些希望找到英偉達(dá)芯片替代方案的科技公司,已經(jīng)在測試亞馬遜最新的AI芯片,并取得了令人鼓舞的結(jié)果。
Hutt在亞馬遜AWS年度客戶大會(huì)表示:“去年,人們開始意識(shí)到,‘嘿,亞馬遜在AI芯片上的投資是認(rèn)真的?!局埽嗳讼嘈胚@是一個(gè)真實(shí)且持續(xù)的投入?!?/p>
分析認(rèn)為,如果亞馬遜能夠?qū)⒖蛻糁С鲛D(zhuǎn)移到其自研的服務(wù)器芯片上,由于這些芯片部分因?yàn)楹碾娏窟h(yuǎn)低于英偉達(dá)芯片而對(duì)云客戶更加便宜,這將提升亞馬遜的利潤率。此外,這也能阻止英偉達(dá)通過直接向企業(yè)出租其芯片服務(wù)器,搶占更多云市場份額。
英偉達(dá)在AI芯片領(lǐng)域的主導(dǎo)地位一直難以撼動(dòng),這部分歸因于其芯片比包括亞馬遜、微軟和谷歌在內(nèi)的競爭對(duì)手生產(chǎn)的芯片更強(qiáng)大,同時(shí),軟件開發(fā)者習(xí)慣于使用英偉達(dá)專有的Cuda編程語言為其芯片編寫軟件。
盡管如此,Hutt和其他亞馬遜高管本周表示,大客戶正在尋求更便宜的替代方案。AWS CEO Matt Garman表示,使用亞馬遜的AI芯片成本比英偉達(dá)的旗艦H100芯片低30%到40%,但能實(shí)現(xiàn)同等性能。
目前,亞馬遜已經(jīng)在開發(fā)傳統(tǒng)服務(wù)器芯片方面建立了一定的影響力,并成功說服客戶租用這些芯片。近年來,AWS客戶越來越多地使用亞馬遜的Graviton服務(wù)器芯片,而不是由英特爾和AMD提供芯片的服務(wù)器,因?yàn)镚raviton通常性價(jià)比更高。
例如,企業(yè)軟件公司Databricks已經(jīng)成為Graviton的重要客戶,其高管Naveen Rao表示,計(jì)劃使用亞馬遜的新AI芯片以降低運(yùn)行軟件的成本。
亞馬遜開發(fā)芯片(包括AI芯片Trainium)的舉措是其更廣泛戰(zhàn)略的一部分,這一戰(zhàn)略旨在將計(jì)算的“基本構(gòu)件”——從服務(wù)器到云軟件——轉(zhuǎn)變?yōu)榱畠r(jià)的通用商品。類似地,亞馬遜CEO Andy Jassy本周宣布了一款由亞馬遜打造的新對(duì)話式AI模型,他表示,其性能與Anthropic和OpenAI的最新模型相當(dāng),但價(jià)格卻低了三倍以上。
Hutt還談到了公司的新Trainium芯片,以及AWS正在為Anthropic建造的一套超級(jí)計(jì)算服務(wù)器集群。Anthropic是OpenAI的競爭對(duì)手,也是AWS近年來營收增長的重要貢獻(xiàn)者之一,目前是AWS上最多使用英偉達(dá)服務(wù)器的客戶之一。
以下是媒體采訪Gadi Hutt的對(duì)話節(jié)選:
1. 使用Trainium2(亞馬遜芯片的最新版本),為什么你們要專注于把這款芯片賣給那些在英偉達(dá)芯片上花費(fèi)巨大的公司?
Hutt:那些關(guān)注機(jī)器學(xué)習(xí)成本的客戶,通常是花費(fèi)較大的客戶,包括蘋果、Adobe、Databricks等,還有一些資金充裕的初創(chuàng)公司,比如Poolside和Anthropic。
對(duì)他們來說,關(guān)鍵指標(biāo)是“每1美元能獲得多少性能”。還有許多其他客戶,我們稱之為“長期客戶”,他們有各種項(xiàng)目非常適合我們的芯片。但也許他們每月的花費(fèi)只有1000美元,這種情況下不值得工程師投入時(shí)間去探索這種選項(xiàng)。
實(shí)際上,在Trainium2生命周期的這個(gè)階段,我并不尋求吸引上百萬個(gè)客戶。就機(jī)器學(xué)習(xí)而言,我們還處于非常早期的階段。人們還在嘗試攻克通用人工智能(AGI)和各種各樣的想法,這個(gè)領(lǐng)域還在不斷演變。
我們不能從第一天起就支持所有的用例。如果客戶嘗試運(yùn)行一些無法正常工作的東西,這會(huì)是一種非常糟糕的體驗(yàn)。因此,我們專注于聽取最大客戶的需求,“嘿,這是我們需要的”,而這往往是對(duì)整個(gè)市場未來需求的一個(gè)很好的預(yù)測。
2. Trainium2在明年的目標(biāo)是什么?
Hutt:當(dāng)我們部署大量芯片時(shí),我們的目標(biāo)是確保它們被充分利用。所以我們首先需要與這些大客戶合作,然后再擴(kuò)展到我所說的“長期客戶”。對(duì)我們這些制造芯片的人來說,成功的衡量標(biāo)準(zhǔn)是確保所有芯片都被充分利用。不管是10個(gè)客戶還是1000個(gè)客戶,數(shù)量是次要的。
這是場馬拉松,而不是短跑。隨著時(shí)間的推移,我們希望看到越來越多的客戶。我不會(huì)在內(nèi)部制定目標(biāo),規(guī)定要啟用多少客戶。我們更關(guān)注的是確保為客戶提供合適的工具和性能,采用率自然會(huì)隨之提高。
3. 為什么第一代Trainium芯片沒有成功推廣?第二代有什么不同?
Hutt:首先,這是我們的第一款訓(xùn)練芯片。你可以看看Trainium1(2022年發(fā)布)與Graviton1(2019年發(fā)布)的對(duì)比,同樣的故事。Graviton1實(shí)際上是為了啟用整個(gè)生態(tài)系統(tǒng),包括軟件生態(tài)系統(tǒng),并確保我們?yōu)榭蛻魳?gòu)建了正確的產(chǎn)品。
Trainium1的客戶(包括亞馬遜內(nèi)部的團(tuán)隊(duì))幫助我們強(qiáng)化了軟件,但工作仍未完成。在支持更多工作負(fù)載方面,我們還有很多工作要做。不過,現(xiàn)在我們可以說,我們對(duì)Trainium2能夠支持的工作負(fù)載感到非常滿意,包括大型語言模型(LLM)、專家模型、多模態(tài)模型以及計(jì)算機(jī)視覺模型。
這需要時(shí)間,而且很復(fù)雜。如果很容易,更多人早就做到了。
4. AWS的客戶是否在考慮明年選擇租用Trainium2還是英偉達(dá)的Blackwell芯片?
Hutt:客戶喜歡有選擇的余地。我們的工作是確保我們的芯片即使與英偉達(dá)的最新芯片相比,也依然具有吸引力,目前確實(shí)如此。
順便說一句,我們還沒有見到72芯片的Blackwell系統(tǒng)投入使用,但假設(shè)英偉達(dá)能夠交付,Trainium2依然會(huì)更具成本效益。
Trainium3(預(yù)計(jì)2025年底發(fā)布)的計(jì)算能力是Trainium2的四倍,因此客戶了解我們的發(fā)汗路線圖。他們有信心認(rèn)為,這是一個(gè)值得投資的方向,否則他們不會(huì)選擇它。
5. 你認(rèn)為英偉達(dá)GPU的需求是否會(huì)發(fā)生變化?
Hutt:有很多客戶想使用英偉達(dá)芯片,不愿了解Trainium芯片。如果你是小型GPU消費(fèi)者,每次穩(wěn)定使用10、20、30甚至100個(gè)GPU,沒有動(dòng)力去改變現(xiàn)狀。即使每月能省下幾千美元,你可能也更愿意讓工程師去做別的事情。
當(dāng)客戶關(guān)心成本問題時(shí),通常是在他們開始擴(kuò)大規(guī)模時(shí),但大規(guī)模的客戶并不多。所以對(duì)我們來說,這些芯片是長期投資,以確保我們?yōu)榭蛻籼峁┻x擇。如果客戶選擇使用它們很好,但如果不選擇,我們依然是運(yùn)行GPU的最佳平臺(tái)。
我們的軟件成熟度會(huì)隨著時(shí)間的推移而提高,希望屆時(shí)會(huì)有更多客戶選擇使用Trainium。但GPU對(duì)我們來說也是一項(xiàng)好業(yè)務(wù),我們?cè)谫u很多。所以,如果客戶希望我們?yōu)樗麄兲峁〨PU,我們會(huì)永遠(yuǎn)這么做。
6. 使用Trainium芯片是否會(huì)提高AWS的利潤率?
Hutt:我們不會(huì)披露利潤率的具體情況,但我們?cè)谶@些芯片上并沒有虧損。業(yè)務(wù)必須有存在的意義,否則我們不會(huì)在這里投資。
7. 客戶何時(shí)開始對(duì)Trainium2感興趣?
Hutt:我記得與Poolside(一家AI編碼助手初創(chuàng)公司)的第一次會(huì)議。當(dāng)我們向他們展示Trainium2的規(guī)格時(shí),他們說,“好吧,這正是我們需要的?!?/p>
8. Anthropic的超級(jí)計(jì)算機(jī)集群項(xiàng)目Rainier的耗電量是多少?
Hutt:我們沒有披露具體數(shù)據(jù)。但我可以告訴你,它比等效的GPU效率高50%。
9. 超級(jí)計(jì)算機(jī)何時(shí)能在Anthropic投入使用?
Hutt:Rainier項(xiàng)目很快就會(huì)完成,我們已經(jīng)在建造中。他們可以逐步開始使用部分集群,而不需要等到最后一顆芯片上線后再使用。隨著集群擴(kuò)展,他們可以逐步增加使用量。
10. Anthropic是否是唯一可以使用Rainier項(xiàng)目的公司?
Hutt:是的,僅供Anthropic使用。
我們正在建設(shè)更多的產(chǎn)能,以滿足其他客戶使用Trainium的需求。目前,短期內(nèi)需求大于供應(yīng)。所以第一季度將非常緊張,隨著產(chǎn)能增加,情況會(huì)有所改善。
評(píng)論