超能課堂(290):處理器是如何從單核演化到64核的(2)
首款六核處理器:Core i7-980X
2010年3月16日推出的Core i7-980X是首款6核處理器,核心代號(hào)Gulftown,它基于Westmere架構(gòu) ,也就是Nehalem的32nm版本,所以也繼承了整合三通道內(nèi)存控制器、QPI總線、Turbo Boost以及重新啟用的超線程技術(shù),處理器每核心擁有256KB L2緩存,共享12MB L3緩存,主頻是3.33GHz,最高睿頻3.6GHz。
由于X58屬于HEDT平臺(tái),所以Gulftown六核其實(shí)也沒(méi)幾款,前后一共才出了四顆,售價(jià)也高高在上,對(duì)市場(chǎng)影響有限,但它的存在是給對(duì)手六核Phenom II X6的一個(gè)降維打擊,性能遠(yuǎn)超對(duì)手,發(fā)布也比你早一個(gè)月,用的工藝也比你先進(jìn)一代,在當(dāng)時(shí),從CPU技術(shù)上講,AMD徹底失去了“話語(yǔ)權(quán)”,當(dāng)然了如果說(shuō)對(duì)市場(chǎng)的影響,便宜的Phenom II X6比高價(jià)的Core i7-980X要大多了。
首款八核處理器:AMD FX-8100系列
其實(shí)說(shuō)2011年AMD推出的Bulldozer推土機(jī)是首款八核處理器估計(jì)會(huì)有很大爭(zhēng)議,因?yàn)樗且粋€(gè)模塊化的CPU,每個(gè)模塊內(nèi)有2個(gè)整數(shù)單元和1個(gè)高度共享的浮點(diǎn)單元,AMD的FX系列處理器最多擁有4個(gè)這樣的模組,而AMD將每個(gè)整數(shù)單元都視為一個(gè)核心,所以FX-8100系列也成為世界上首款原生8核桌面CPU。
當(dāng)然了,推土機(jī)處理器的性能有多糟糕我已經(jīng)不想再提了,當(dāng)年關(guān)于AMD FX系列處理器是否是“真8核”很多玩家與AMD之間出現(xiàn)爭(zhēng)議,一些玩家甚至認(rèn)為AMD涉嫌非法宣傳,將AMD告上了法庭,最后這官司還贏了,AMD因此而吃了罰單。
首發(fā)的FX-8100系列有五個(gè)型號(hào),最高加速頻率是4.5GHz,每個(gè)模組共享2MB L2緩存,所有核心共享8MB L3緩存,TDP有95W和125W兩種。一年后推出的Piledriver打樁機(jī)處理器則是推土機(jī)的改良版本,不過(guò)性能其實(shí)也沒(méi)高多少,F(xiàn)X-8300系列一共有7個(gè)型號(hào),最高加速頻率降至4.3GHz,TDP同樣是95W或125W,不過(guò)嘛,還有FX-9590和FX-9370兩個(gè)標(biāo)配一體式水冷散熱器的奇特產(chǎn)品,他們的TDP高達(dá)220W,前者最高加速頻率達(dá)到了5GHz,后者也有4.7GHz,當(dāng)年是AMD追高頻追得比較瘋狂。
其實(shí)推土機(jī)一共有四代架構(gòu),除了上面已經(jīng)提到的推土機(jī)和打樁機(jī)之外,還有Steamroller壓路機(jī)以及Excavator挖掘機(jī),但AMD在推出打樁機(jī)后就放棄了與Intel在高端平臺(tái)上的爭(zhēng)奪市場(chǎng),后面兩種架構(gòu)只出現(xiàn)在APU上。
而桌面市場(chǎng)的第一顆真八核處理器是Intel在2014年推出Core i7-5960X,屬于22nm的Haswell-E架構(gòu) ,基礎(chǔ)頻率3GHz,最高睿頻3.5GHz,擁有20MB L3緩存,是用HEDT的X99平臺(tái)上的,999美元的高昂售價(jià)也讓許多玩家望而卻步。
至于主流平臺(tái)的八核處理器,則是2017年AMD Zen架構(gòu)的第一代Ryzen 7系列處理器,是它正式引發(fā)了Intel與AMD在處理器市場(chǎng)上的核心數(shù)量大戰(zhàn)。
首款十核處理器:Core i7-6950X
Intel在2016年5月發(fā)布的Core i7-6950X是首款桌面的十核處理器,它所用的Broadwell-E架構(gòu)其實(shí)就是Haswell-E的制程升級(jí)版,生產(chǎn)工藝從22nm升級(jí)到14nm,核心數(shù)量從上代Core i7-5960X的8核增加到10核,晶體管數(shù)量也從26億增加到32億,但因?yàn)楦冗M(jìn)的制程工藝,芯片面積從355.52mm2縮減到246mm2。
除了核心數(shù)量與制程之外,Core i7-6950X與Core i7-5960X的區(qū)別其實(shí)不算大,L3緩存容量增加到25MB,基礎(chǔ)頻率依然是3.0GHz,最大睿頻2.0頻率3.5GHz,但在這一代處理器Intel引入了Turbo Boost Max 3.0技術(shù),最高單核睿頻能到4.0GHz,此外支持DDR4的頻率也從2133MHz提升到2400MHz,但這個(gè)對(duì)于X99主板來(lái)說(shuō)意義不大。
而主流市場(chǎng)的10核處理器直到2020年5月才到來(lái),它就是Core i9-10900K,目前市場(chǎng)上就Comet Lake這一代有10核的產(chǎn)品,最新一代的Rocket Lake最多就只有8核,AMD的Zen 2因?yàn)榧軜?gòu)問(wèn)題8核以上只能出12核或16核的產(chǎn)品,而Zen 3理論上是能出10核或者14核的,但AMD可能覺(jué)得沒(méi)必要所以沒(méi)出。
Intel Skylake-X:12/14/16/18核一同到來(lái)
在2017年6月份,Intel推出了第七代Core X系列處理器,不過(guò)這代產(chǎn)品有點(diǎn)奇葩,有Skylake-X與Kabylake-X兩種不同架構(gòu)的處理器,當(dāng)中Kabylake-X可以說(shuō)是非???,所以后續(xù)也沒(méi)有類似的產(chǎn)品了,而Skylake-X則與以往HEDT產(chǎn)品一樣源于服務(wù)器處理器。
與上一代X99平臺(tái)的Broadwell-E處理器相比,Skylake-X處理器多了12核、14核、16核、18核的產(chǎn)品,并且用Core i9取代Core i7成為Intel消費(fèi)級(jí)市場(chǎng)上最強(qiáng)處理器的代名詞。
Skylake-X與主流級(jí)的Skylake相比,緩存結(jié)構(gòu)有了明顯的調(diào)整,L2緩存從每核心256KB提升到1MB,L3則從每核心共享2MB變成了1.375MB,這樣做可以提升L2的命中率降低訪問(wèn)延遲,提升IPC。此外網(wǎng)狀總線取代了環(huán)形總線,這樣有利于拓?fù)涓嗪诵臄?shù)量,AVX-512指令集也是從這代架構(gòu)開(kāi)始引入的。Turbo Boost MAX 3.0從Broadwell-E的只能提升單核頻率變成最多可以提升兩個(gè)核心的頻率,但頻率提升幅度沒(méi)以前那么大。
第7、9、10代Core X處理器都是用Skylake-X架構(gòu)的,雖然第10代的代號(hào)改成了Cascade Lake,但本質(zhì)上就是Skylake-X,就多了4條PCI-E通道并且強(qiáng)化了AI性能。
不過(guò)實(shí)際上第一個(gè)上市的12核和16核處理器是AMD的銳龍Threadripper 1920X和1950X,他們?cè)?017年8月份就上市了,而Intel只是在6月份紙面發(fā)布了第七代Core X系列處理器,7月份首批上市的只有10核及以下的產(chǎn)品,12和到18核的產(chǎn)品要等到10月份才上市。
在2019年,AMD推出了Zen 2架構(gòu)的銳龍3000系列處理器,把12核與16核處理器推向了主流市場(chǎng)。
Ryzen Threadripper系列:24/32甚至64核
實(shí)際上這些年挑起核心數(shù)量大戰(zhàn)的不是Intel,而是AMD,他們?cè)诘谝淮鶨PYC上玩起MCM之后就一發(fā)不可收拾,而基于EPYC的銳龍Threadripper自然也這樣,第一代銳龍Threadripper處理器最大核心數(shù)量只有16,而到了2018年發(fā)布的第二代銳龍Threadripper,最大核心數(shù)量直接翻倍到32。
銳龍Threadripper 2990WX
銳龍Threadripper 2000系列處理器采用12nm Zen+內(nèi)核,分為WX系列和X系列,X系列和第一代是一樣的,只有兩個(gè)內(nèi)核可工作的內(nèi)部雙路系統(tǒng),最大核心數(shù)16個(gè),而WX系列則是四個(gè)內(nèi)核都可工作的,和服務(wù)器的EPYC一樣內(nèi)部是四路互聯(lián),最大核心數(shù)32個(gè)。
核心之間采用25GBps的Infinity Fabric總線互聯(lián),只有核心0和核心2提供內(nèi)存控制器和PCI-E控制器, 于核心1和核心3是沒(méi)有直接連接內(nèi)存和PCI-E的,銳龍Threadripper 2970WX/2990WX只能工作在NUMA模式,這核心1/3的通信延遲明顯高于核心0/2,所以會(huì)限制這兩個(gè)核心的性能。
銳龍Threadripper 3990X
到了Zen 2架構(gòu)的銳龍Threadripper 3000,CPU被拆分成CCD計(jì)算核心和IOD輸入輸出核心,所有的內(nèi)存、PCI-E、USB、SATA控制器轉(zhuǎn)移到了IOD上,CCD與IOD之間采用第二代Infinity Fabric總線連接,這樣延遲雖然會(huì)有所增加,但是很好的解決了每個(gè)核心之間訪問(wèn)內(nèi)存和PCI-E時(shí)延遲不一的問(wèn)題,并且每個(gè)IOD最多可連接8個(gè)CCD,于是就有了64核的銳龍Threadripper 3990X。
Intel Lakefield:開(kāi)啟混合架構(gòu)新時(shí)代的五核處理器
Intel的Lakefield項(xiàng)目其實(shí)在2019年就正式公開(kāi)了,而產(chǎn)品正式上市是2020年,這款產(chǎn)品的實(shí)驗(yàn)性質(zhì)很重,它是首款采用Intel Foveros 3D堆疊工藝的產(chǎn)品,也是首款采用混合架構(gòu)的x86處理器。
Lakefield SoC至少包含四個(gè)層,頂部?jī)蓪邮怯蒔oP封裝的DRAM內(nèi)存所組成,由兩塊BGA DRAM堆疊在一起,第三層則是由10nm工藝打造的CPU與GPU,最底層則是由22nm工藝打造的I/O與緩存層。
10nm工藝的計(jì)算芯片包含一個(gè)Sunny Cove大核,獨(dú)享512KB L2緩存,四個(gè)Tremont小核,它們共享1.5M L2緩存,所有核心共享4MB的L3緩存,內(nèi)存控制器是4*16位的,支持LPDDR4,整合了Gen 11核顯,有64個(gè)EU單元,Gen 11.5顯示控制器還有新的IPU,支持DP 1.4。
Lakefield家族只有Core i5-L16G7和Core i3-L13G4兩款產(chǎn)品,兩者的主要區(qū)別的是頻率以及核顯的EU數(shù)量,只有少數(shù)輕薄本用了這款處理器,性能表現(xiàn)其實(shí)還不錯(cuò),5W的Core i5-L16G7甚至可以與15W的Core i5-10210U叫板。
在經(jīng)過(guò)Lakefield的小規(guī)模實(shí)驗(yàn)后,Intel的混合架構(gòu)將會(huì)在這個(gè)月底發(fā)布的Alder Lake處理器上開(kāi)花結(jié)果,大家可以期待桌面滿血的混合架構(gòu)x86處理器到底會(huì)怎么樣的表現(xiàn),而Foveros 3D堆疊工藝也會(huì)用在未來(lái)的Xe-HPC服務(wù)器計(jì)算卡上。
展望未來(lái)
在可預(yù)見(jiàn)的將來(lái),桌面市場(chǎng)的最大核心數(shù)量依然會(huì)維持在64核,因?yàn)镮ntel和AMD的新一代HEDT處理器完全沒(méi)有消息,但從兩家最新的服務(wù)器處理器來(lái)看,Intel的最多不會(huì)超過(guò)40核,而AMD最多也是64核,Intel把雙芯Xeon下放到HEDT平臺(tái)可能性非常小,主要看點(diǎn)還是AMD未來(lái)的Zen 4,有消息說(shuō)Zen 4架構(gòu)的EPYC處理器最多能到96核,但是否會(huì)下放到HEDT平臺(tái)這就不太確定了。
主流平臺(tái)方面,目前的消息是代號(hào)為Raphael的Zen 4處理器最高配置依然為16核,Intel方面下一代的Raptor Lake則最多24核,但是由16個(gè)E-Core加8個(gè)P-Core所組成的,也就是說(shuō)最多32線程,線程數(shù)和Zen 4的16核保持一致,但這些都不是實(shí)錘的消息,還有很大不確定性。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。