微處理器 多核已成為主流
不管是通用微處理器還是專(zhuān)用微處理器乃至異構(gòu)微處理器,都已經(jīng)進(jìn)入多核時(shí)代,通過(guò)多核技術(shù)提高處理能力,同時(shí)降低電能消耗已成為微處理器的必然選擇。
本文引用地址:http://cafeforensic.com/article/93249.htm隨著半導(dǎo)體細(xì)微化進(jìn)程,提高芯片性能和減少電能消耗成為一對(duì)矛盾。之前的單核處理器主要通過(guò)提高指令的并行運(yùn)算速度來(lái)提高器件性能,具體方法包括使用超標(biāo)量、超級(jí)流水線和亂序執(zhí)行等技術(shù)同時(shí)進(jìn)行處理以及通過(guò)超長(zhǎng)指令字的指令集結(jié)構(gòu)來(lái)提高并行運(yùn)算性能。這些復(fù)雜的計(jì)算處理耗用大量晶體管資源,使得微處理器在電能的消耗上一直無(wú)法降低,而多核結(jié)構(gòu)的設(shè)計(jì)思路是通過(guò)減少并行處理,適當(dāng)?shù)亟档兔總€(gè)核的工作強(qiáng)度來(lái)降低整個(gè)處理器的耗電。
一年來(lái),多個(gè)廠商已經(jīng)或計(jì)劃推出一批多核處理器。在通用多核處理器上,有IBM的PowerXCell8i、Sun公司的Rock處理器、富士通的SPARC64VII、英特爾i7、Tukwila和AMD的Shanghai四核處理器和我國(guó)的龍芯-3等。它們有4至9個(gè)核。此外,在專(zhuān)用多核處理器上,有美國(guó)思科公司推出的40核的數(shù)據(jù)包處理器。美國(guó)NVIDI公司市售的240個(gè)核的GTX200線程處理器,處理能力到達(dá)同時(shí)執(zhí)行300個(gè)線程。英特爾公司去年4月公布了多核圖像處理器Larrabee。還有美國(guó)Tilera公司的擁有64個(gè)內(nèi)核的嵌入式微處理器等。以上專(zhuān)用式多核處理器都有幾十個(gè)核到上百個(gè)核。
消費(fèi)市場(chǎng),情形類(lèi)似,目前市場(chǎng)上銷(xiāo)售的個(gè)人電腦或服務(wù)器其處理器大多集成有2個(gè)內(nèi)核,4核架構(gòu)的也已經(jīng)上市。近來(lái),多核微處理器已開(kāi)始進(jìn)入通信和家用電器領(lǐng)域,可以說(shuō),多核微處理器將成為今后的潮流。
通用多核處理器:眾廠商各展其長(zhǎng)
IBM的PowerXCell8i處理器是新一代的Cell多核處理器。值得一提的是,目前世界上運(yùn)算速度最快的超級(jí)計(jì)算機(jī)Roadrunner就采用了這款處理器。
PowerXCell8i采用了CellBroadbandEngine(Cell寬帶引擎)結(jié)構(gòu),包括1個(gè)Power處理器PPE和8個(gè)優(yōu)化的增強(qiáng)雙精度(eDP)SIMD引擎,即協(xié)處理器SPE,PPE核旨在運(yùn)行操作系統(tǒng)和協(xié)同計(jì)算,8個(gè)SPE核及其SIMD執(zhí)行單元可提高固定點(diǎn)算法的性能。每個(gè)IBMPowerXCell8i處理器的二級(jí)緩存為512KB,每個(gè)eDPSPE的本地存儲(chǔ)器容量為256KB。IBM的PowerXCell8i多核處理器的雙精度性能是上一代Cell寬帶引擎處理器的5倍。它的多核架構(gòu)和超高速通信功能大幅度地提高了實(shí)時(shí)響應(yīng)速度。結(jié)合先進(jìn)的多處理技術(shù),該處理器特別適合于高性能工作負(fù)載。PowerXCell8i處理器采用了非對(duì)稱(chēng)多核結(jié)構(gòu),非常適合于并行處理和流處理應(yīng)用程序。與無(wú)法高效處理流處理應(yīng)用程序的基于緩存的對(duì)稱(chēng)多核結(jié)構(gòu)不同,PowerXCell8i處理器是專(zhuān)為提供較高的性能和快速響應(yīng)而設(shè)計(jì)的。
由于PowerXCell8i提供了一種經(jīng)濟(jì)型的超級(jí)計(jì)算能力,因此可用于高性能服務(wù)器和大型計(jì)算機(jī)之中。當(dāng)前世界上運(yùn)算速度最快的計(jì)算機(jī)的運(yùn)算速度是每秒可進(jìn)行1105萬(wàn)億(petaflop)次的浮點(diǎn)運(yùn)算,其異構(gòu)集群結(jié)構(gòu)中就大量采用了這款處理器。
Sun公司16核的Rock處理器擁有尖兵線程(ScoutThread)和事務(wù)型內(nèi)存。前者是用于收集數(shù)據(jù)而先執(zhí)行的線程。Rock處理器采用的是一種指令型的并行處理,是由軟件來(lái)實(shí)現(xiàn)的。它可節(jié)約收集數(shù)據(jù)的時(shí)間。處理器在進(jìn)行計(jì)算時(shí)會(huì)遇到一些遲延時(shí)問(wèn)較長(zhǎng)的運(yùn)算,例如緩存的Misshit(沒(méi)有命中,脫靶)和除法運(yùn)算。這時(shí)尖兵線程就可以先進(jìn)行數(shù)據(jù)收集等處理過(guò)程。當(dāng)完成了這些延時(shí)較長(zhǎng)的計(jì)算時(shí),尖兵線程就可將結(jié)果反映給寄存器,隨后繼續(xù)進(jìn)行下一個(gè)處理。事務(wù)型內(nèi)存將一連串的存取操作作為“事務(wù)”進(jìn)行管理,避免了資源競(jìng)爭(zhēng)并且易于進(jìn)行并行處理。其設(shè)計(jì)理念是采用了鎖相控制模式,阻止軟件的多線程同時(shí)訪問(wèn)共享數(shù)據(jù)區(qū)(即一個(gè)線程正在使用某數(shù)據(jù)時(shí),其他線程不得更改該數(shù)據(jù)),從而使一個(gè)單線程將僅找到唯一的數(shù)據(jù)堆棧,保障了多線程處理的一致性,因而利于進(jìn)行高速連續(xù)處理。由于上述原因,這款Sun處理器加強(qiáng)了亂序執(zhí)行能力,提高了單線程的功能。
評(píng)論