蘋果在論文中表示,支持其Apple Intelligence AI系統(tǒng)的人工智能模型是在谷歌設計的處理器上預訓練的,這表明大科技公司在訓練前沿AI時正在尋找替代Nvidia的方法。
本文引用地址:
http://cafeforensic.com/article/202407/461513.htm蘋果選擇谷歌自家設計的Tensor Processing Unit(TPU)進行訓練,這在公司剛剛發(fā)布的技術論文中有詳細說明。蘋果周一還發(fā)布了Apple Intelligence的預覽版。
Nvidia昂貴的圖形處理單元(GPU)在高端AI訓練芯片市場占據(jù)主導地位,過去幾年需求旺盛,以至于很難以所需數(shù)量采購到。OpenAI、微軟和Anthropic都在使用Nvidia的GPU進行模型訓練,而其他科技公司,包括谷歌、Meta、甲骨文和特斯拉,也在大量采購這些芯片來構建他們的AI系統(tǒng)和產(chǎn)品。
Meta首席執(zhí)行官馬克·扎克伯格和Alphabet首席執(zhí)行官桑達爾·皮查伊上周都表示,他們的公司和行業(yè)中的其他公司可能在AI基礎設施上過度投資,但承認不這樣做的商業(yè)風險太高。
“落后的壞處在于,你在未來10到15年最重要的技術上處于不利位置,”扎克伯格在與彭博社的Emily Chang的播客中說。
蘋果在其47頁的論文中沒有提到谷歌或Nvidia,但確實提到其Apple Foundation Model(AFM)和AFM服務器是在“云TPU集群”上訓練的。這意味著蘋果租用了云提供商的服務器來進行計算。
“該系統(tǒng)使我們能夠高效、可擴展地訓練AFM模型,包括AFM-on-device、AFM-server和更大模型,”蘋果在論文中說。
蘋果和谷歌的代表沒有回應置評請求。
健康的AI懷疑態(tài)度對技術行業(yè)有益,Light Street的Glen Kacher說健康的AI懷疑態(tài)度對技術行業(yè)有益,Light Street的Glen Kacher說
蘋果比許多同行更晚披露其AI計劃,這些同行在OpenAI于2022年底推出ChatGPT后很快就大聲宣布了生成性AI的擁抱。周一,蘋果推出了Apple Intelligence。該系統(tǒng)包括幾個新功能,例如Siri的新外觀、更好的自然語言處理以及文本字段中的AI生成摘要。
在接下來的一年中,蘋果計劃推出基于生成性AI的功能,包括圖像生成、表情符號生成以及可以訪問用戶個人信息并在應用程序內(nèi)執(zhí)行操作的增強版Siri。
在周一的論文中,蘋果表示,AFM-on-device是在一個由2048個TPU v5p芯片協(xié)同工作的一片“切片”上訓練的。這是最先進的TPU,首次發(fā)布于去年12月。AFM-server是在8192個TPU v4芯片上訓練的,這些芯片通過數(shù)據(jù)中心網(wǎng)絡配置為八片切片協(xié)同工作。
根據(jù)谷歌的網(wǎng)站,谷歌最新的TPU在提前預訂三年的情況下,每小時使用成本低于2美元。谷歌首次在2015年推出其TPU用于內(nèi)部工作負載,并于2017年向公眾開放。它們現(xiàn)在是專為人工智能設計的最成熟的定制芯片之一。
盡管如此,谷歌仍是Nvidia的頂級客戶之一。它在自己的TPU上使用Nvidia的GPU進行AI系統(tǒng)訓練,還在其云端出售Nvidia技術的訪問權限。
蘋果此前曾表示,推理,即使用預訓練的AI模型生成內(nèi)容或做出預測,將部分在其數(shù)據(jù)中心的蘋果自家芯片上進行。
這是蘋果發(fā)布的關于其AI系統(tǒng)的第二篇技術論文,此前在6月發(fā)布了一版更為通用的版本。蘋果當時表示,在開發(fā)其AI模型時使用了TPU。
蘋果計劃在周四交易結束后公布季度業(yè)績。
評論