色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專欄

          EEPW首頁(yè) > 博客 > Alder Lake處理器深入把玩:雙內(nèi)核效能對(duì)比,未來移動(dòng)版性能預(yù)覽

          Alder Lake處理器深入把玩:雙內(nèi)核效能對(duì)比,未來移動(dòng)版性能預(yù)覽

          發(fā)布人:超能網(wǎng) 時(shí)間:2021-12-19 來源:工程師 發(fā)布文章

          其實(shí)自Intel Alder Lake處理器要用x86混合架構(gòu)的消息傳出,與之相關(guān)的爭(zhēng)論就沒停過,爭(zhēng)論的重點(diǎn)基本上都在桌面處理器有沒有必要用E-Core這一點(diǎn),對(duì)于移動(dòng)處理器來說,E-Core確實(shí)挺有用的,畢竟筆記本的體積是有限的,要控制發(fā)熱量,而且還需要考慮續(xù)航問題,降低發(fā)熱和功耗這正是E-Core在行的。但臺(tái)式機(jī)的散熱器大得多,處理器的熱功耗設(shè)計(jì)和筆記本相比可以大許多, 也不需要太過在意節(jié)能的問題。

          1.jpg

          那么為什么Intel還要在Alder Lake-S里面塞E-Core呢?Alder Lake所用的P-Core也就是Golden Cove的IPC與頻率都很高,有著很強(qiáng)的單線程性能,而想提升多線程性能的話就需要堆砌大量的P-Core,不過P-Core的核心面積實(shí)在是太大了,堆太多的話發(fā)熱太大就會(huì)影響頻率。還有就是芯片面積的問題,下一代Xeon可擴(kuò)展處理器Sapphire Rapids單個(gè)芯片里面就有15個(gè)Golden Cove,根據(jù)Intel的資料它的芯片面積大約是400mm2,這尺寸肯定不能直接扔主流消費(fèi)市場(chǎng)。

          那么如果確保處理器有足夠的單線程性能,又在不大幅增加芯片面積的情況下增加多線程性能呢?Intel給出的答案就是混合架構(gòu)的Alder Lake,在此架構(gòu)里P-Core的目的是提升處理器的單線程性能,而E-Core的設(shè)計(jì)目的則是用更低的功耗來提升多線程性能,因?yàn)镋-Core相當(dāng)省晶體管,大概4個(gè)E-Core的芯片面積才和1個(gè)P-Core這么大。

          2.jpg

          這里直接借用一下@Locuza_做的圖

          從上圖可以看到,1個(gè)E-Core的芯片面積大概1.7mm2,而4個(gè)E-Core加上2MB L2緩存的面積是8.78mm2,只是略大于一個(gè)P-Core加上它的1.25MB L2緩存,但根據(jù)官方的說法,4個(gè)E-Core所提供的多線程性能是要遠(yuǎn)高于1個(gè)開啟超線程的P-Core的,所以桌面的Alder Lake-S上那8個(gè)E-Core的主要作用確實(shí)是用來拉高處理器的多線程性能的,節(jié)能作用只是其次。

          3.jpg

          桌面版Alder Lake-S的8P+8E組合是Alder Lake里面核心數(shù)量最多的,移動(dòng)版的Alder Lake-P最多只有6P+8E,但核顯的規(guī)模增大,并且增加了Thunderbolt 4控制器和IPU圖像處理單元,低功耗移動(dòng)版更是只有2P+8E,而下一代的Raptor Lake處理器更是打算把E-Core數(shù)量增加到16個(gè) ,看來這E-Core是真的好用,而且堆起來性價(jià)比也很高。

          其實(shí)我們?cè)谑诇y(cè)的時(shí)候是想單獨(dú)測(cè)試P-Core和E-Core的性能的,但實(shí)際上只能單獨(dú)把E-Core完全關(guān)閉,P-Core至少得保留一個(gè),所以那時(shí)候就沒關(guān)于E-Core的測(cè)試,現(xiàn)在我們換個(gè)思路,來試下不同P-Core和E-Core的組合會(huì)對(duì)性能有什么影響。

          測(cè)試平臺(tái)與說明

          4.png

          測(cè)試平臺(tái)就是同步評(píng)測(cè)那套,使用Core i9-12900K處理器,華碩ROG MAXIMUS Z690 HERO主板,兩條16GB芝奇RIPJAWS S5 DDR5-5200內(nèi)存,時(shí)序是CL40-40-40-76,顯卡是NVIDIA GeForce RTX 3090 Founder Edition。這次測(cè)試是通過關(guān)閉Core i9-12900K的P-Core和E-Core來驗(yàn)證不同核心組合性能,我們并不會(huì)處理器的頻率做任何改動(dòng),如果沒特殊說明的話就是默認(rèn)解鎖功耗限制,這次只是一個(gè)驗(yàn)證性的測(cè)試,所以測(cè)試的項(xiàng)目會(huì)比首發(fā)評(píng)測(cè)少很多。

          Core i9-12900K默認(rèn)的睿頻設(shè)置請(qǐng)看下表:

          5.png

          驗(yàn)證一:4P和2P+8E誰更強(qiáng)

          為什么會(huì)選這樣的組合來測(cè)呢?因?yàn)?個(gè)E-Core的芯片面積和1個(gè)P-Core大致相同,Intel也說過2個(gè)P-Core加8個(gè)E-Core的多線程性能是比4個(gè)P-Core更好的,所以我們就來驗(yàn)證一下,附帶測(cè)下1 P-Core+8 E-Core以及1 P-Core+4 E-Core的組合。

          理論測(cè)試

          6.png7.png8.png9.png

          單純看各個(gè)測(cè)試的多線程測(cè)試的話,2P+8E的組合多線程性能是要比4P更強(qiáng)的,畢竟核心線程數(shù)量差距擺在那里,兩個(gè)P-Core多線程性能確實(shí)不如8個(gè)E-Core,甚至1P+8E的多線程性能也和4P差不多。

          但認(rèn)真去看這些數(shù)據(jù)的話,你會(huì)發(fā)現(xiàn)只剩1個(gè)P-Core時(shí)單線程性能是明顯下降了的,這可能與Windows的顯存輔助均衡調(diào)度算法有關(guān)。

          此外看3DMark CPU Profile的測(cè)試結(jié)果,4個(gè)P-Core在4線程和8線程時(shí)得分是要比2P+8E要高的,單線程性能相同,雙線程的結(jié)果可能是單純的測(cè)試誤差,說明在8個(gè)線程內(nèi)P-Core其實(shí)要比2P+8E更強(qiáng),只有在兩個(gè)都是最大線程時(shí)多線程性能才會(huì)拉開差距。

          其實(shí)如果光看多線程性能的話,8個(gè)E-Core是肯定要比2個(gè)P-Core更好的,兩者的芯片面積也差不多,那在有限尺寸的晶圓上全堆E-Core多線程性能不是更好?更何況Gracemont架構(gòu)本身是支持超線程的,只不過在Alder Lake里面它是E-Core沒這個(gè)必要所以沒開而已,事情肯定沒這么簡(jiǎn)單,不然Intel也不會(huì)畫這么大力氣去搞個(gè)混合架構(gòu)了。

          游戲性能

          10.png

          消費(fèi)級(jí)處理器在絕大部分情況下都不會(huì)全線程一齊負(fù)載的,單線程性能有多重要這個(gè)游戲就會(huì)告訴你,測(cè)試的4個(gè)游戲里面4P與2P+8E在《全面戰(zhàn)爭(zhēng):三國(guó)》和《Far Cry 6》幀數(shù)差距不大,但《古墓麗影:暗影》與 《銀河破碎者》里2P+8E就明顯落后4P很多,如果進(jìn)一步削減P-Core數(shù)量的話性能下降得更厲害,1P+8E的游戲性能與2P+8E差很多,1P+4E的性能下降幅度反而沒那么大。

          很明顯,E-Core在游戲里面幫不上太大的忙,主要還是得看單線程性能強(qiáng)得多的P-Core,就如Intel在架構(gòu)日上所說的那樣,P-Core是用來提供單線程性能的,而E-Core則是在盡量節(jié)能的情況下提升多線程性能。

          功耗測(cè)試

          11.png12.png

          雖然我沒對(duì)Core i9-12900K的頻率進(jìn)行改動(dòng),但因?yàn)轭nl的關(guān)系它在不同核心數(shù)量時(shí)頻率還是不一樣的,核心數(shù)量越少全核頻率就越高,這會(huì)對(duì)CPU的功耗帶來微妙的影響,但整體來說還是關(guān)閉核心帶來的影響更大,4個(gè)P-Core的功率是要比2個(gè)P-Core加8個(gè)E-Core功耗高8%的,后者的組合帶來的多線程提升反而更大一點(diǎn),怪不得Intel下一代產(chǎn)品還要繼續(xù)增加E-Core數(shù)量。

          2P+8E跑FPU的功耗是112W,而1P+8E則是84W,大致可推算出一個(gè)P-Core的功耗是28W,而1P+4E的功耗是60W,大致可推算出一組4個(gè)E-Core的功耗是24W,當(dāng)然這只是大致的推算,并不是十分準(zhǔn)確的數(shù)值,但依然看得出E-Core在能耗方面確實(shí)要比P-Core好不少。

          驗(yàn)證二:超線程有多大作用

          由于Core i9-12900K是16核24線程的,然后你會(huì)發(fā)現(xiàn)把E-Core關(guān)閉或者把P-Core的超線程關(guān)閉的話都會(huì)變成16線程,只是這16線程的組成成分不太一樣,下面就來對(duì)比一下這兩個(gè)組合的性能,并且會(huì)放上完整的Core i9-12900K的成績(jī)作為參照。

          理論測(cè)試

          13.png14.png15.png16.png

          基本上這三種組合單線程性能沒多大差別,多線程性能大部分情況下8P+8E 16T是要優(yōu)于8P 16T的,畢竟多了8個(gè)物理核心怎么都比8個(gè)邏輯核心要強(qiáng),當(dāng)然7-Zip的解壓縮測(cè)試是個(gè)例外,只有這里8P 16T是要比8P+8E 16T更強(qiáng)的。

          3DMark CPU Profile這個(gè)分線程數(shù)的測(cè)試我們能看出更多有趣的事,8P 16T在4線程和8線程的成績(jī)是要遠(yuǎn)比8P+8E 16T和8P+8E 24T更低的,2線程時(shí)也略微低一些,這很有可能是線程調(diào)用出了問題,在E-Core開啟的時(shí)候線程被正確分配到P-Core上,沒有調(diào)用到虛擬的邏輯核心,但在只有P-Core的時(shí)候調(diào)度可能出了問題,線程被分配到邏輯核心上,導(dǎo)致性能明顯下降。

          16線程時(shí)8P 16T的得分也是低于8P+8E 16T的,不過這就不是線程調(diào)度的原因了,單純是8個(gè)E-Core性能比8個(gè)P-Core超線程弄出來的邏輯核心性能更強(qiáng)。8P+8E 16T在8線程和16線程時(shí)性能比8P+8E 24T好一點(diǎn),這是因?yàn)镻-Core在關(guān)閉超線程后全核頻率從4.8GHz提升到4.9GHz,而且我們可以從16線程的得分看出此時(shí)Core i9-12900K是優(yōu)先使用E-Core來進(jìn)行負(fù)載的,而不是使用P-Core的超線程。

          游戲性能

          17.png

          這三個(gè)組合的游戲性能差別倒是不大,畢竟P-Core數(shù)量管夠,硬要說的話就是關(guān)閉超線程后性能會(huì)高那么一點(diǎn)點(diǎn),因?yàn)檫@種情況下P-Core的全核頻率更高,關(guān)閉超線程也對(duì)CPU的單線程性能有輕微提升,但不怎么明顯就是了。

          功耗測(cè)試

          18.png19.png

          Core i9-12900K在華碩ROG Z690 Hero主板上跑AIDA 64 FPU AVX2負(fù)載時(shí)功耗是242W,關(guān)閉全部E-Core的話功耗會(huì)降低到213W,而關(guān)閉超線程的功耗則是214W,兩者的功耗如此接近比較意外的,當(dāng)然了兩者的溫度其實(shí)相差很遠(yuǎn),關(guān)閉E-Core后會(huì)讓熱量更為集中,就算用360一體式水冷也很難壓住,關(guān)閉超線程的話會(huì)降低P-Core的發(fā)熱,讓CPU溫度下降到只有70多度。

          驗(yàn)證三:預(yù)測(cè)下未來的移動(dòng)版Alder Lake

          移動(dòng)版的Alder Lake-P會(huì)在明年1月的CES上發(fā)布,和桌面版Alder Lake-S相比,核顯的EU單元從32個(gè)增加到96個(gè),而CPU則從8P+E8變成了6P+8E,核顯規(guī)模我們沒法模擬,但CPU性能我們可以通過減少兩個(gè)P-Core和限制CPU的PL1和PL2功耗進(jìn)行模擬,當(dāng)然了,Core i9-12900K的L3緩存應(yīng)該會(huì)比移動(dòng)版處理器多6MB,這個(gè)就沒辦法了。

          這個(gè)測(cè)試?yán)锩嫖覀儠?huì)把Core i9-12900K關(guān)到6P+8E的狀態(tài),會(huì)分別測(cè)試解鎖功耗以及把功耗限制到PL2=105W,PL1=45W,Tau=56秒的性能,這功耗限制是我們根據(jù)現(xiàn)在的11代酷睿H45處理器來設(shè)定的,未來的Alder Lake H45的標(biāo)準(zhǔn)功耗估計(jì)也差不多這樣,而測(cè)試解鎖功耗限制的是單純想看看這種核心組合的性能上限,畢竟不少游戲本也會(huì)把處理器的PL1和PL2值設(shè)置到很高,當(dāng)然性能肯定會(huì)和我們現(xiàn)在用桌面處理器模擬有一定差距。

          理論測(cè)試

          20.png21.png22.png23.png24.png

          從各個(gè)測(cè)試來看,單線程性能基本沒太大影響,畢竟只有單線程輔助時(shí)根本摸不到PL2的105W,基本可以滿血跑完所有的測(cè)試。多線程的話,如果不限制功耗,6P+E8依然會(huì)比8P+8E性能下降10%~20%,加上功耗限制影響就大了,像CPU-Z這樣的短時(shí)間測(cè)試性能降幅不會(huì)很明顯,因?yàn)槎荚赑L2的時(shí)間范圍內(nèi),而R23這種10分鐘以上的長(zhǎng)時(shí)間測(cè)試,只有56秒的PL2就可以忽略不計(jì)了,絕大部分時(shí)間都只有45W,性能降幅相當(dāng)明顯。

          但換個(gè)角度去看,Core i9-12900K關(guān)掉兩個(gè)核后FPU烤機(jī)功率是175W,把它限制成只有45W的話依然能發(fā)揮出原本60%的性能,Alder Lake架構(gòu)以及Intel 7工藝在能耗方面確實(shí)做得很不錯(cuò)。

          游戲性能

          25.png

          把Core i9-12900K關(guān)兩個(gè)P-Core游戲性能影響不大,也就《銀河破碎者》這個(gè)比較吃CPU的有一點(diǎn)下降,限制功耗后,有三款游戲大概有10%的幀率下降,《全面戰(zhàn)爭(zhēng):三國(guó)》這游戲這么吃CPU性能居然沒變我是比較驚訝的。

          從測(cè)試結(jié)果來看未來的移動(dòng)版Alder Lake處理器性能還是比較不錯(cuò)的,在限制了功耗的情況下最差情況下依然有Core i9-12900K的一半性能,如果負(fù)載較輕時(shí)會(huì)發(fā)揮出更佳性能,當(dāng)然實(shí)際在筆記本上肯定會(huì)被散熱設(shè)計(jì)以及搭配的內(nèi)存影響性能發(fā)揮,我們的測(cè)試只是大致模擬。

          總結(jié)

          簡(jiǎn)單歸納一下這次測(cè)試,Alder Lake里面的一個(gè)P-Core和四個(gè)E-Core芯片面積接近,四個(gè)E-Core的多線程性能大概比一個(gè)P-Core高出10~15%,而且功耗要低15%左右,在提升多線程性能和降低功耗方面,E-Core功不可沒,所以Intel下一代的Raptor Lake打算繼續(xù)堆E-Core來提升多線程性能。

          當(dāng)然了,只有E-Core是肯定不行的,因?yàn)镋-Core的IPC只比Skylake好一點(diǎn),而且它的頻率并不算高,實(shí)踐證明P-Core數(shù)量太少的話會(huì)嚴(yán)重影響游戲性能,至于需要多少個(gè)P-Core那就得看游戲需求了,每個(gè)主線程能分到一個(gè)獨(dú)立的P-Core那當(dāng)然是最好的狀態(tài),Alder Lake以及Raptor Lake最多8個(gè)P-Core的設(shè)計(jì)Intel肯定是在多年的數(shù)據(jù)收集后統(tǒng)計(jì)出來的。

          關(guān)閉P-Core的超線程對(duì)Core i9-12900K來說大概會(huì)讓多線程性能降低10~30%,具體數(shù)值得看負(fù)載是什么,不過可以確定的是在16線程內(nèi)的負(fù)載是不會(huì)造成任何影響的,只有在需要調(diào)用超過16線程時(shí)才會(huì)動(dòng)用到邏輯核心,關(guān)閉超線程的話可以讓CPU的溫度與功耗大幅降低,這也是解決Core i9-12900K溫度過高的其中一個(gè)方法,當(dāng)然不怎么建議這么做就是,限制功耗同樣可以達(dá)到降溫的目的,而且性能損失沒那么大。

          在對(duì)未來移動(dòng)版的Alder Lake處理器的模擬當(dāng)中,我們可以看出這處理器的能耗比其實(shí)是相當(dāng)棒的,在關(guān)閉兩個(gè)核心并且限制PL1=45W后,此時(shí)滿載功耗只有原來的18.5%,它依然能發(fā)揮出接近Core i9-12900K至少50%的多線程性能,而游戲性能方面至少有80%,明年的Alder Lake-P移動(dòng)處理器是相當(dāng)值得期待的。

          *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



          關(guān)鍵詞: CPU

          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉