新的Arm GPU助力釋放消費電子設備市場中的游戲和AI創(chuàng)新潛能
作為人們?nèi)粘?shù)字生活中不可或缺的一部分,Arm GPU賦能了從當今智能手機上的沉浸式游戲,到各類邊緣側(cè)人工智能 (AI) 體驗的方方面面。目前,Arm合作伙伴的GPU出貨量已超過100億顆,而這一卓越成就歸功于我們業(yè)界領先的生態(tài)系統(tǒng)。這些 GPU 廣泛應用于包括智能手機、平板電腦、智能電視、機頂盒、智能手表和 XR 可穿戴設備在內(nèi)的各類消費電子設備。
本文引用地址:http://cafeforensic.com/article/202406/459861.htm去年此時,我們推出了新的第五代GPU架構及一系列新的GPU,包括 Arm Immortalis-G720 GPU。 MediaTek的天璣9300 系統(tǒng)級芯片(SoC)平臺便采用此GPU。之后,知名手機廠商vivo和OPPO的旗艦智能手機都先后采用了該芯片。
今年,我們很高興推出第二代基于Arm第五代GPU架構構建的GPU產(chǎn)品,成為 Arm 終端計算子系統(tǒng) (CSS) 的重要組件。其中包括新的 Arm Immortalis-G925 GPU、Arm Mali-G725 GPU 和 Arm Mali-G625 GPU,它們適用于從旗艦智能手機、高端手機,到智能手表、入門級移動設備等各類消費電子設備,這些 GPU 產(chǎn)品的兩大設計重心:
● 作為手機游戲持續(xù)演進的一部分,實現(xiàn)沉浸式視覺體驗
● 在主流應用中加速實現(xiàn) AI 體驗
出色的游戲性能
去年推出的 Immortalis-G720 在多數(shù)的圖形基準測試中都以其峰值性能(每秒幀數(shù), fps)和更長游戲時間的持續(xù)性能擊敗對手。通過推出 Arm 目前性能最強、效率最高的 GPU —— Immortalis-G925,我們持續(xù)推動這一出色表現(xiàn)。在 Arm 參考平臺上進行比較時,Immortalis-G925 的性能 (fps) 比 Immortalis-G720提高了 37%。此外,在提供與 Immortalis-G720 相當?shù)挠螒蛐阅軙r,Immortalis-G925 的功耗降低了 30%。
圖 Immortalis-G720對比其他SoC在領先的圖形基準測試中的表現(xiàn)情況
這一出色性能延伸到了關鍵的手機游戲領域,與 Immortalis-G720 相比,Immortalis-G925 的性能平均提升了 46%。單看各款游戲,《原神》的性能提升 49%,而《Roblox》的運行速度加快 46%。其他熱門手機游戲的性能提升幅度均在 29% 至 72% 之間,包括《使命召喚手游》、《暗黑破壞神:不朽》、《明日之后》、《堡壘之夜》和《絕地求生手游》。
這些令人驚喜的游戲改進對于開發(fā)者和最終的游戲玩家來說都意義非凡。
圖 Immortalis-G925整體性能提升
不斷追求更逼真的游戲體驗
手游內(nèi)容趨勢的演變是Arm持續(xù)關注的重點,用以確保我們的 GPU 產(chǎn)品能滿足開發(fā)者和生態(tài)系統(tǒng)合作伙伴的需求。Immortalis-G925 也不例外,該 GPU 專為最新的游戲技術、功能和趨勢而設計。而正是整個生態(tài)系統(tǒng)的協(xié)同合作,造就了更優(yōu)異的游戲體驗。
近年來,場景幾何在手游領域持續(xù)發(fā)展,其可增加游戲?qū)ο蟮那逦?,有助于?chuàng)建更逼真的地形,并為游戲角色賦予更高的真實感。事實上,隨著開發(fā)者努力創(chuàng)建更多的場景細節(jié)和更高的真實感,熱門游戲《堡壘之夜》和《原神》的幾何復雜度同比增長了 9% 至 11%。
復雜的片段著色技術通過為對象和角色賦予紋理感,制作出更逼真的游戲體驗。該技術可實現(xiàn)高質(zhì)量游戲效果,如光暈、模糊和基于物理的著色。在《堡壘之夜》和《原神》中,片段著色器在 GPU 上花費的時間激增,同比增加 27% 到 43%。
為滿足針對更復雜幾何體的需求,Immortalis-G925引入了片段預處理 (Fragment Prepass) 的新機制。借助該圖形技術,應用無需進行任何對象或原語排序,并且在處理幾何工作負載時,能夠更高效地減少過度繪制。通過片段預處理,我們觀察到由于無需對象排序,渲染線程周期縮短高達 43%。這不僅提高了性能和能效,也減少了 CPU 的負載。
自從在 Immortalis-G715 GPU 中引入光線追蹤以來,該技術正愈發(fā)普遍,其有助于創(chuàng)建更真實的陰影、反射和高級光照效果。Immortalis-G925 持續(xù)推動光線追蹤內(nèi)容的改進,對復雜對象的光線追蹤性能提高了 52%。通過對光線追蹤內(nèi)容進行內(nèi)部測試,我們正進一步提高其性能。例如,在游戲場景透明度方面保持相同準確度的同時,性能提升 27%。開發(fā)者也可選擇將游戲場景透明度的準確性略微降低,由此帶來高達 52% 的驚人性能提升,并降低 57% 的內(nèi)存流量。
圖 Immortalis-G925光線追蹤提升
增加著色器核心,以支持更多的消費市場
為應對筆記本電腦、Chromebook 和游戲手機等各類消費電子設備市場日益增長的性能需求,Immortalis-G925 所支持的著色器核心數(shù)量增加了 50%,達到 24 個核心的最大配置,而上一代最多只有 16 個。
為擴展到該性能點,圖塊吞吐量和命令流前端 (Command Stream Front-end, CSF) 均經(jīng)過更改和優(yōu)化。我們已經(jīng)能夠?qū)D塊吞吐量翻番,并對 CSF 進行了多項改進,包括對關鍵命令的硬件支持和增加硬件接口數(shù)量,以加快將作業(yè)分配給著色器核心的速度。
在新推出的 GPU 中,著色器核心的數(shù)量均已擴展。Immortalis-G925 可配置 10 個以上的核心,適用于旗艦智能手機等高性能消費技術市場。Mali-G725 可在六至九個核心之間擴展,主要針對高端手機市場。此外,它還能提供與 Immortalis-G925 相同的 API 支持,同時為 Immortalis-G925 目標范疇以外的稍低級別設備提供引人入勝的沉浸式游戲體驗。Mali-G625 可在一至五個核心之間擴展,適用于智能手表和入門級移動設備。
圖 Immortalis-G925、Mali-G725和Mali-G625的核心數(shù)
AI性能提升
與前幾代產(chǎn)品一樣,我們不斷提升 AI 工作負載在 GPU 上的性能和效率。作為 Arm 終端 CSS 的重要組件,Immortalis-G925 在 AI 和機器學習 (ML) 網(wǎng)絡中的推理速度比 Arm 2023 全面計算解決方案 (TCS23) 中的 Immortalis-G720 提高了 34%。雖然大多數(shù) AI 處理工作能夠在 CPU 上進行,但 GPU 為各種 AI 用例提供加速功能,包括圖像分類、圖像分割、對象檢測、自然語言處理和語音轉(zhuǎn)文本等。
與 TCS23 中的 Immortalis-G720 相比,Immortalis-G925 作為 Arm 終端 CSS 的一部分,在關鍵用例中提供一系列 AI 性能改進。在圖像處理方面(包括分割和分類),Immortalis-G925可實現(xiàn)41%的性能提升,表現(xiàn)搶眼。同時,在超級采樣任務中,開發(fā)者可以使用神經(jīng)網(wǎng)絡對圖像進行向上擴展,其性能可提高近30%,而在自然語言處理和語音轉(zhuǎn)文本,性能可提高 50%,同樣十分驚艷。
圖 Immoratlis-G925 AI性能提升
此外,Arm正攜手生態(tài)系統(tǒng)合作伙伴,以提高AI性能。通過與Unity合作,我們幫助將int8支持引入面向基于 Unity 應用的ML框架Sentis。采用int8后,其性能提升44%,同時內(nèi)存占用空間減少,從而改善了基于ML的移動游戲體驗。
最后,作為 Arm 終端 CSS 的一部分,我們協(xié)同設計并交付 GPU 物理實現(xiàn)。我們攜手領先的代工廠合作伙伴,實現(xiàn)了流片就緒的 Immortalis-G925 三納米工藝的物理實現(xiàn),助力我們的合作伙伴能夠在三納米工藝上充分發(fā)揮功耗、性能和面積 (PPA) 優(yōu)勢,同時通過生產(chǎn)就緒的芯片解決方案來縮短芯片的開發(fā)與部署時間。
生態(tài)系統(tǒng)協(xié)作推動圖形技術進步
除了推出 GPU 新品,Arm 還致力于與游戲生態(tài)系統(tǒng)合作,從而帶來先進的圖形特性和功能。
我們正在與 Epic Games 攜手,在安卓上啟用其虛幻引擎 5 (Unreal Engine 5) 桌面平臺渲染器。對于開發(fā)者來說,這將確保 Immortalis 和 Mali GPU 也能在移動設備上提供桌面級質(zhì)量的渲染和圖形效果。作為虛幻引擎 5 桌面平臺渲染器相關工作的一部分,用于光線追蹤的 Lumen 光照解決方案已針對 Arm GPU 進行了優(yōu)化,尤其是支持基于硬件光線追蹤的 GPU。使用 Lumen 的開發(fā)者可以利用我們的最佳實踐建議來管理場景復雜性、更新頻率和探測器設置,達到游戲主機品質(zhì)的光照效果。
我們還與 Google 和 MediaTek 圍繞安卓動態(tài)性能框架 (Android Dynamic Performance Framework, ADPF) 展開合作。借助這一來自 Google 的強大 API,開發(fā)者能夠根據(jù)移動設備的實時熱狀態(tài)信息來優(yōu)化其應用的用戶體驗和性能。在手機游戲等高要求應用中,這可以降低功耗、避免過熱并延長游戲時間。通過在 Arm 技術驅(qū)動的 Google Pixel 8 智能手機上啟用 ADPF,我們在 2024 世界移動通信大會 (MWC 2024) 上展示了 Steel Arms 手機游戲演示,呈現(xiàn)了25% 的每幀能耗減低,以及 35% 的幀速率提升。
與此同時,Arm還通過一系列GPU工具和資源,保持對游戲開發(fā)者一貫的生態(tài)系統(tǒng)支持。Arm Performance Studio 延續(xù) Arm Mobile Studio 的成功,借助擴展分析工具,進一步支持移動設備和 GPU 以外的一系列新工作負載、平臺和設備,包括面向服務器市場的CPU和Arm Linux平臺。作為Arm Performance Studio的一部分,我們新增了Arm Frame Advisor,使開發(fā)者能夠更易實現(xiàn)圖形分析和優(yōu)化,從而更準確地針對其優(yōu)化目標,并更快地將軟件推向市場。
為新一代AI和游戲體驗而打造
隨著手游和AI工作負載的不斷演進,新一代 Arm GPU 可提供出色的性能和效率優(yōu)勢,帶來無可匹敵的用戶體驗。之前的 Arm GPU 已應用于主要的消費電子設備中,并展現(xiàn)出優(yōu)異的峰值和持續(xù)游戲性能,而新一代 GPU 將延續(xù)先前產(chǎn)品的強勁勢頭。
通過Immortalis-G925、Mali-G725和Mali-G625,我們的目標是覆蓋從旗艦到入門等不同級別的廣泛消費電子設備,我們看到越來越多的消費者與合作伙伴要求更加沉浸式的手游和 AI 體驗。我們新的 GPU 能夠滿足這些需求,提供無與倫比的游戲和 AI 性能。這意味著,全球數(shù)百萬開發(fā)者和數(shù)十億用戶與基于 Arm 架構的設備進行交互,將獲得更快、更沉浸式、更智能的視覺體驗。
評論