高通驍龍 8 至尊版移動平臺解析 + 體驗:自研 Oryon CPU 不負(fù)所望
10 月 22 日,高通在 2024 驍龍峰會上正式推出了全新一代旗艦移動平臺驍龍 8 至尊版(Snapdragon 8 Elite),今年的驍龍旗艦移動平臺,主打一個“新”,新的命名方式,新的自研 CPU 架構(gòu),還融入了諸多行業(yè)領(lǐng)先的新技術(shù),旨在樹立移動數(shù)智計算的新標(biāo)桿。
本文引用地址:http://cafeforensic.com/article/202410/463853.htm關(guān)于驍龍 8 至尊版,看過發(fā)布會的朋友應(yīng)該已經(jīng)了解了它的基本參數(shù),不過在參數(shù)背后,還有很多直接挖掘的看點和細(xì)節(jié),今天就和大家一起梳理一下驍龍 8 至尊版的一些技術(shù)細(xì)節(jié),并和大家分享此前測試驍龍 8 至尊版工程機的一些結(jié)果。
一、全新 Oryon 架構(gòu) CPU
這次驍龍 8 至尊版最重要的看點,就是其采用了全新的高通自研 Oryon 架構(gòu) CPU。此前的 PC 平臺驍龍 X Elite / X Plus,高通其實就采用了自研的 Oryon 架構(gòu) CPU,而這次是高通 Oryon CPU 首次應(yīng)用在移動平臺芯片上。
我們首先來看一下驍龍 8 至尊版上 Oryon CPU 的核心架構(gòu),本質(zhì)上這是一枚全大核的架構(gòu),包括兩個最高主頻 4.32GHz 的 Phoenix L 超大核心和 6 個最高主頻 3.53GHz 的 Phoenix M 大核心。其中兩枚超大核心分別擁有 192KB 的 L1 緩存,共享 12MB 的大容量 L2 緩存,6 枚大核心 L1 緩存為 128KB,共享 12MB L2 緩存,總計達(dá)到 24MB 緩存,沒有 L3 緩存,對于驍龍 8 至尊版來說,也不需要 L3 緩存。
同時驍龍 8 至尊版還將支持速率高達(dá) 10.7Gbps 的 LPDDR5X 內(nèi)存。
對比上一代的驍龍 8 Gen 3,高通表示,基于 GeekBench 的測試結(jié)果,驍龍 8 至尊版的 CPU 單核性能提升達(dá)到 45%,多核性能提升也高達(dá) 45%。
而在 Speedometer 的測試中,驍龍 8 至尊版的提升更是顯著,相比上一代提升了 62%。
這里要說明的是,Speedometer 的基準(zhǔn)測試重點關(guān)注利用瀏覽器棧和框架的應(yīng)用的響應(yīng)速度和性能,用于衡量 CPU 處理用戶日常實際任務(wù)的效率。它能夠反映在執(zhí)行瀏覽任務(wù)時的性能表現(xiàn),如加載網(wǎng)頁、運行 web 應(yīng)用和與在線內(nèi)容交互。
同時這項基準(zhǔn)測試能夠體現(xiàn)處理器在實際應(yīng)用場景中高效地處理 CPU 高負(fù)載任務(wù)的能力,并且與日常瀏覽器用例以及和基于 Chromium 內(nèi)核的應(yīng)用如微信,淘寶的流暢度密切相關(guān),因此能夠更準(zhǔn)確地反映移動終端上的用戶體驗。
為了驗證驍龍 8 至尊版的實際性能表現(xiàn),不久前也使用搭載驍龍 8 至尊版的工程機做了跑分測試。
首先是 GeekBench 6.2.0 的跑分,驍龍 8 至尊版單核成績?yōu)?3223 分,多核則直接來到了 10538 分,十分彪悍。而且這還是工程機的跑分表現(xiàn),相信后續(xù)量產(chǎn)機上市后隨著終端廠商的調(diào)校優(yōu)化,驍龍 8 至尊版的跑分會更高。
然后是安兔兔 Benchmark V10.2.1,雖然這反應(yīng)的是綜合性能的跑分,這里我們也先做一下參考,驍龍 8 至尊版綜合成績達(dá)到了 3047845 分,其中 CPU 為 677702 分,GPU 為 1254918 分,表現(xiàn)同樣非常搶眼。
Speedometer 的跑分測試這里也為大家展示一下,驍龍 8 至尊版的成績可以達(dá)到 33.0 分,相較于上一代確實有明顯的升級。
二、Adreno 830 GPU 及游戲體驗
除了 Oryon CPU,全新驍龍 8 至尊版平臺搭載了最新的 Adreno 830 GPU,這枚 GPU 相較于上一代在性能上實現(xiàn)了 40% 的提升,同時功耗也降低了 40%,另外在游戲場景比較看重的光線追蹤性能方面,Adreno 830 GPU 也有高達(dá) 35% 的性能提升。
性能和能效大升級的背后,Adreno 830 GPU 在整體架構(gòu)上也作出了重要變革,這一代 GPU 在渲染來源層面上分為了三個 Slice,每一個 GPU Slice 都能達(dá)到 1.1GHz 的性能水平,這樣設(shè)計的好處是可以根據(jù)用戶的需求進行靈活地調(diào)配。因此在驍龍 8 至尊版上高通也為 GPU 增加了一個整體的調(diào)控引擎(Commond Processor)。
不僅如此,高通還在驍龍 8 至尊版上為 Adreno 830 GPU 引入了一個 12MB 的專屬圖形內(nèi)存。我們知道,在進行圖形渲染時,需要不斷地去搬運圖形數(shù)據(jù),所以免不了要和 DDR 進行交互,頻繁訪問 DDR 會顯著增加功耗,而有了這個專門供 GPU 使用的 Cache,就可以大幅減少對 DDR 的訪問,高通表示整體來說可以降低 40% 左右,這也是 Adreno 830 GPU 性能大幅提升的同時,功耗也能顯著降低的關(guān)鍵因素。
說到 GPU 就不得不提到游戲體驗,而影像游戲體驗的一個重要因素就是幀率。全新驍龍 8 至尊版將此前的 Adreno 圖像運動引擎(Adreno Frame Motion Engine,下面簡稱 AFME)升級到了 2.0。此前的 AFME 主要是基于圖像進行插幀,而 AFME 2.0 則是基于游戲里的 3D 信息,同時結(jié)合圖像背景信息進行運算,因此可以做到更精準(zhǔn)的插幀效果,并且圖像畫質(zhì)受到的影響也會非常少。
CPU 方面也使用搭載驍龍 8 至尊版的工程機進行了測試,可供大家做參考。首先是 GFXBench 的測試。在 Aztec Ruins Vulkan (Normal Tier) Offscreen (1080p) 的測試中,Adreno 830 GPU 跑到了 348 Fps 的成績。
然后又測了 Aztec Ruins Vulkan (High Tier) Offscreen (1440p) 項目,Adreno 830 GPU 的成績?yōu)?125 Fps,表現(xiàn)也很出色。
隨后也測試了 3D Mark 能夠代表現(xiàn)代 GPU 圖形渲染性能的 Steel Nomad Light 項目,成績?yōu)?2605 分,這個表現(xiàn)就目前來看對比競品最新的旗艦平臺也是有明顯領(lǐng)先優(yōu)勢的。
除了專門的 GPU 測試,我們也做了實際游戲的測試體驗,主要使用《原神》和《崩壞:星穹鐵道》這兩款游戲進行測試。
首先是《原神》,測試時游戲的畫質(zhì)選項設(shè)置如下:
測試時主要是在游戲的楓丹城內(nèi)跑圖,由于現(xiàn)場測試時間比較有限,這里進行 15 分鐘的測試。
測試結(jié)束后,可以看到游戲運行的平均幀率為 59.9fps,看幀率曲線幾乎也是一條直線。需要說明的是,幀率曲線中間歇性的瞬時掉幀,經(jīng)確認(rèn)是由于測試當(dāng)天《原神》游戲版本更新產(chǎn)生的問題,與驍龍 8 至尊版的性能表現(xiàn)無關(guān)。如果將這些瞬時掉幀去掉,可以看到游戲運行的幀率曲線確實基本就是一條直線,非常平穩(wěn)。
同時,游戲運行時的平均功耗只有 4.1W,從實際測試時的體感來看,工程機的發(fā)熱也并不明顯。
接著IT之家又實用《原神》測試了驍龍 8 至尊版 AFME 2.0 的效果,測試時小編將《原神》的幀率設(shè)置為 30 FPS,其他選項不變,然后開啟 AFME 2.0 30 FPS 插幀到 60 FPS 的功能,可以看到在測試軟件中顯示游戲幀率確實達(dá)到了 60 FPS。
進行 4 分鐘左右的測試后,可以看到游戲的平均幀率達(dá)到了 60.2 FPS,而功耗則降低到了 3.3W,降幅可以達(dá)到 20% 左右。
另外從實際體驗的感受來看,開啟 AFME 2.0 后,游玩時不僅更加流暢,而且?guī)缀醺惺懿坏疆嬞|(zhì)有什么損失,和原生的游戲畫面基本沒差,并且游戲中的人物進行高速運動時,畫質(zhì)也沒有因為插幀而出現(xiàn)錯誤的情況,高速運動下人物的運動依然比較細(xì)膩自然,可見高通在 AFME 2.0 的優(yōu)化上確實下了功夫。
隨后又用《崩壞:星穹鐵道》做了測試,測試時的畫質(zhì)設(shè)置如下:
測試時,主要是沿著星槎海中樞 —— 長樂天 —— 太卜寺 —— 星槎海中樞進行沖刺循環(huán)跑圖。再次說明由于測試時間有限,這次小編只測了 3 分鐘左右,共大家參考,可以看到游戲運行的平均幀率為 59.7 FPS,穩(wěn)幀指數(shù)達(dá)到 1.4,幀率曲線也是非常平穩(wěn)的,實際體驗感受絲滑流暢。
此外,游戲運行時的平均功耗為 5.3W,這個功耗控制對于《崩壞:星穹鐵道》這樣的游戲來說也是比較出色的了。
然后小編再度開啟 AFME 2.0,將游戲原生幀率設(shè)置為 30 FPS,其他不變,再進行測試。這次可以看到游戲平均幀率達(dá)到了 59.9 FPS,插幀的效果非常穩(wěn)定。
再看游戲運行時的功耗,降低到了 4.1W,降幅接近 23%。
整體來看,驍龍 8 至尊版的 GPU 性能顯然屬于當(dāng)前天花板的級別,同時 AFME 2.0 技術(shù)的加入可以讓大家在進行游戲時獲得更流暢的幀率體驗,這也讓人更加期待打在驍龍 8 至尊版的終端在經(jīng)過手機廠商們深度調(diào)校后,量產(chǎn)上市時的表現(xiàn)。
3、AI 引擎性能躍升
在驍龍 8 至尊版上,高通 AI 引擎也迎來了重要升級,得益于更強的 Oryon CPU、Adreno GPU 以及 Hexagon NPU 等模塊,驍龍 8 至尊版實現(xiàn)了 AI 性能 45% 的提升,同時最高單瓦性能(能效)也提升了 45%,可見這一代驍龍 8 至尊版各方面動輒就是 40% 以上的升級,可以說是把牙膏擠爆了。
以 MLPerf 的 AI 性能基準(zhǔn)測試為準(zhǔn),全新驍龍 8 至尊版在各個項目上的表現(xiàn)都較上一代驍龍 8 Gen 3 有明顯升級,比如 Mosaic(圖像分割)項目相比上一代快了 31%,EDSR(超分)性能更是提升了 104%,SSD-Mobilenet(object detection,對象檢測)性能提升了 23%,MobileBERT (reading comprehension,閱讀理解) 項目提升了 45%,Mobilenet EdgeTPU (image classification,圖像分類) 也有 35% 的提升。
在 AI 性能方面,使用驍龍 8 至尊版工程機做了測試,首先是 AITUTU Benchmark v3.5.0 的測試,驍龍 8 至尊版達(dá)到了 2024820 分,其中 Super Resolution(超分)為 532574 (SNPE),Style Transfer(圖像風(fēng)格遷移)為 520208 (SNPE),Image Classification 為 476395 (SNPE)。
而在 AImark 的測試中,驍龍 8 至尊版的成績達(dá)到了 311517 分,也是非常優(yōu)秀的表現(xiàn)。
然后使用 MLPerf 進行了測試,先測試了 Image Classification v2,得分 1594.82 分;
Object Detection 得分為 3166.74;
Language Understanding(語言理解)項目得分為 666.74 分;
Image Classification v2 項目得分為 2069.13 分。
結(jié)語
通過上面的介紹,以及對驍龍 8 至尊版工程機的體驗和測試,相信大家能夠?qū)Ω咄ㄈ乱淮炫炓苿悠脚_的性能和能效,以及 AI 等方面的表現(xiàn)有了更清晰和深入的了解。
總體來說,全新驍龍 8 至尊版對于驍龍旗艦移動平臺產(chǎn)品系列來說無疑會是具有特殊意義的一代產(chǎn)品,全新自研 Oryon 架構(gòu) CPU 在移動芯片上的首次使用,Adreno GPU 的架構(gòu)變革,AI 能力的再次躍進,還有各種創(chuàng)新技術(shù)的引入,都讓驍龍 8 至尊版能夠在越來越激烈的外部競爭環(huán)境中再次確立領(lǐng)先的優(yōu)勢,同時相信隨著高通和終端廠商們的持續(xù)深入合作和聯(lián)合調(diào)校,未來搭載驍龍 8 至尊版的商用終端產(chǎn)品會為我們的移動體驗帶來更多的驚喜。
評論