高性能計算領(lǐng)域群雄逐鹿趨勢分析
高性能計算(HPC)系統(tǒng)一直是新聞媒體關(guān)注的話題,特別是半年一度的高性能計算500強(qiáng)超級計算機(jī)排行榜的發(fā)布。1993年第一次排行榜名列榜首的是擁有1024臺處理器和60千兆計算能力的思維機(jī)CM-5。而如今擁有288 teraflop計算能力的是高性能計算領(lǐng)域中的領(lǐng)跑者IBM公司的"藍(lán)色基因"/L(Blue Gene/L)。性能相當(dāng)于提高了45000倍。
高性能計算(HPC)系統(tǒng)一直是新聞媒體關(guān)注的話題,特別是半年一度的高性能計算500強(qiáng)超級計算機(jī)排行榜的發(fā)布。1993年第一次排行榜名列榜首的是擁有1024臺處理器和60千兆計算能力的思維機(jī)CM-5。而如今擁有288 teraflop計算能力的是高性能計算領(lǐng)域中的領(lǐng)跑者IBM公司的"藍(lán)色基因"/L(Blue Gene/L)。性能相當(dāng)于提高了45000倍。目前有幾家廠商都在打算在年內(nèi)進(jìn)入petaflop級別運(yùn)算的領(lǐng)域。
這個標(biāo)題并不意味著什么,但是他非常的重要:高性能計算價格的下降為它拓寬了用戶的使用范圍。"在低端市場,我們也在尋求中小企業(yè)用戶的支持"位于圣地亞哥的Tabor Communications集團(tuán)旗下的Tabor Research研究機(jī)構(gòu)的資深研究顧問克里斯托弗.威拉德說:"入門級系統(tǒng)在這十年里一直是市場上的主流"。在這個趨勢下很多因素都在發(fā)生著變化。一方面,硬件價格的下降使得那些財富500強(qiáng)和國家研究機(jī)構(gòu)之外的用戶也能夠承受了。另一方面,市場的重點(diǎn)已經(jīng)從硬件轉(zhuǎn)移到軟件,Linux集群已經(jīng)逐步取代了單塊集成電路的超級計算機(jī)設(shè)計模式。
"我們致力于解決如何設(shè)計硬件的問題來使得系統(tǒng)能一起工作,我們也思索如何設(shè)計軟件的問題以便計算機(jī)都一起工作"。唐納德.貝克這樣說到。唐納德.貝克是90年代中期任職于美國國家航空和宇宙航行局戈達(dá)德太空飛行中心,是世界上第一個Linux集群的創(chuàng)建者,目前是位于舊金山的基于Linux的服務(wù)器和集群設(shè)備廠商企鵝計算公司(Penguin Computing)的技術(shù)總監(jiān)。
事實上,Linux集群無論對于高端市場還是低端市場都是一場革命。2007年6月發(fā)布的高性能計算500強(qiáng)排行榜中373家集群廠商赫然在列。現(xiàn)在每個人都可以在家里在不使用高性能計算的情況下創(chuàng)建一個Beowulf集群。不過這個趨勢可能已經(jīng)走到了盡頭。威拉德說,集群已經(jīng)開始逐漸接近高端的極限。將來提升的空間將主要在一些特定的領(lǐng)域,使用為特定目的設(shè)計的處理器來減少主中央處理器的常規(guī)運(yùn)算法則。一些廠商已經(jīng)開始這樣做了。
接下來讓我們一起關(guān)注高性能計算領(lǐng)域目前的發(fā)展現(xiàn)狀,來看看這些生產(chǎn)廠家們是如何來提升他們系統(tǒng)的性能的。
Cray公司
位于美國華盛頓州西雅圖市的Cray公司自從2000年從美國高性能計算領(lǐng)先供應(yīng)商SGI分離出來以后,目前正處于恢復(fù)期。在高性能計算500強(qiáng)排行榜上它有11個系統(tǒng)位列其中,包括No. 2和No. 3 spots。美國橡樹嶺國家實驗室(Oak Ridge National Laboratory)的美洲虎系統(tǒng)是Cray XT3和XT4系統(tǒng)的完美結(jié)合,它使用11,706個AMD公司皓龍?zhí)幚砥饔嬎愎?jié)點(diǎn),46 TB內(nèi)存,比119 teraflops的性能還要卓越。美國橡樹嶺國家實驗室計劃在今年底使系統(tǒng)速度得到雙倍提升,方法就是將系統(tǒng)升級到雙核芯片,雙倍內(nèi)存并在計算節(jié)點(diǎn)上遷移到Linux拆分版上。
"Cray XT4系統(tǒng)是非常完美的系統(tǒng),它能給我們的應(yīng)用軟件提供最為卓越的整體工作性能"美國橡樹嶺國家實驗室項目負(fù)責(zé)人亞瑟.貝萊德說"這個系統(tǒng)還具有很高的量測性并且易于升級"。
Cray公司的XMT超級計算機(jī)平臺是大體積多線程處理系統(tǒng)能處理超過一百萬個并行處理線程。Cray XT4超級計算機(jī)是大體積并行多處理系統(tǒng),采用AMD的HyperTransport技術(shù)和皓龍?zhí)幚砥鬟B同Cray公司的三維互聯(lián)網(wǎng)絡(luò)。它能測量超過1個的petaflop級別運(yùn)算。Cray X1E超級計算機(jī)使用的是矢量處理器。
根據(jù)Cray公司總裁Pete Ungaro的說法,Cray公司計劃在年底前生產(chǎn)出另外一款主流高性能計算產(chǎn)品。
IBM公司
IBM公司繼續(xù)雄踞高性能計算領(lǐng)域的霸主地位。在高性能計算500強(qiáng)排行榜上排名前10位的系統(tǒng)中IBM就占據(jù)六席,前100位的排名中IBM就有46套系統(tǒng)。最大的超級計算機(jī)就是美國勞倫斯利沃莫爾國家實驗室的"藍(lán)色基因"/L(Blue Gene/L)計算機(jī),它每秒運(yùn)算速度超過28o.6萬億次。今年六月,IBM公司推出了Blue Gene/P平臺的改進(jìn)型,它能提升到3個petaflops。
"Blue Gene/P與它的上一代Blue Gene/L相比,性能幾乎提高了三倍。是目前世界上最快的超級計算機(jī)。也在保持"能量使用最有效和空間使用最節(jié)省的計算機(jī)"稱號"IBM公司超級計算機(jī)部門副總裁戴維.特瑞克這樣說道。
象它的前一代一樣,新的超級計算機(jī)使用的也是IBM公司的POWER大型機(jī)處理器。不同之處在于Blue Gene/P使用的是四核模式超越了"藍(lán)色基因"/L(Blue Gene/L)的雙核模式。德國的馬科斯.普朗克研究院在今年9月安裝了世界上第一臺Blue Gene/P超級計算機(jī)。但是由于只有8,192個處理器,新的系統(tǒng)將不能設(shè)置任何記錄。阿貢國家實驗室(Argonne National Laboratory)今年年底也在安裝四核超級計算機(jī),不過只能運(yùn)行111 teraflops,因此它仍然位列美國勞倫斯利沃莫爾國家實驗室的Blue Gene/L計算機(jī)之下。
企鵝計算公司(Penguin Computing)
企鵝計算公司(Penguin Computing)是專門致力于為高端及低端高性能計算領(lǐng)域制造高性能計算集群,服務(wù)器和存儲設(shè)備的生產(chǎn)廠商。它hai 出品了Scyld集群管理軟件。今年1月,企鵝計算公司(Penguin Computing)發(fā)布了一款專為低成本高性能計算集群設(shè)計的服務(wù)器。Altus 600服務(wù)器采用兩臺AMD公司的皓龍?zhí)幚砥?,支?4GB隨機(jī)存儲器,雙核處理器配置。市場定價為1,499美元。這款服務(wù)器去除了高性能計算中不需要的特性,使它比通用目的的服務(wù)器更有效率。
SGI公司
SGI公司的高性能計算機(jī)結(jié)合了它使用現(xiàn)場可編程閘陣列(FPGA)的RASC技術(shù),能使用戶對系統(tǒng)進(jìn)行自定義從而使特別運(yùn)算法則達(dá)到最優(yōu)。這項技術(shù)的應(yīng)用大大減少了計算機(jī)的處理時間。今年六月,SGI公司推出了它專為高性能計算設(shè)計的Altix ICE刀片式計算平臺。
"目前公司的主要任務(wù)是處理更加復(fù)雜的計算問題,隨著用于管理和運(yùn)營的數(shù)據(jù)量的日益增長,對于開發(fā)者而言壓力也是與日俱增"SGI公司程序開發(fā)及戰(zhàn)略客戶總監(jiān)Joe Mansour這樣說道"解決這個問題的一種途徑就是創(chuàng)建大型集群,但是這種方法會導(dǎo)致無法預(yù)料和難以處理的各項費(fèi)用,比如經(jīng)營支出,空間管理和能量消耗等等"。
SGI公司的Altix ICE平臺從另外一個角度來說,也是特別針對高性能計算應(yīng)用軟件而設(shè)計。它具有無線纜的刀片機(jī)箱( IRU )設(shè)計,熱插拔電源和整套高性能互聯(lián)架構(gòu)。這種基礎(chǔ)架構(gòu)在切斷電源和熱力的情況下,使更快的運(yùn)行速度和更高的刀片密度成為可能。Altix ICE平臺還包含了SGI公司新推出的水冷卻通道設(shè)計。
SGI公司通通過這一最新型系統(tǒng)使綠色高性能計算成為現(xiàn)實,她不僅能夠幫助用戶征服高額的電力和制冷花費(fèi),同時通過自己優(yōu)秀的制冷來確保新平臺的最大使用期限。Joe Mansour這樣說道。
SUN微系統(tǒng)公司
SUN微系統(tǒng)公司推出的是使用x86或者SPARC處理器,運(yùn)行Linux操作系統(tǒng)或者Solaris操作系統(tǒng)的刀片高性能計算集群。今年六月,SUN微系統(tǒng)公司宣布推出其星群系統(tǒng)(Constellation System)超級計算機(jī)。這個系統(tǒng)是SUN微系統(tǒng)公司與位于奧斯丁市的德克薩斯大學(xué)共同合作開發(fā)的,使用的是Solaris 10操作系統(tǒng)。德克薩斯高興計算中心正在建立一個超過500千兆兆字節(jié)的星群系統(tǒng)(Constellation System)超級計算機(jī)。這個系統(tǒng)配置是123TB隨機(jī)存儲器和1.7PB原始數(shù)據(jù)磁盤存儲器。SUN微系統(tǒng)公司計劃今年12月投入生產(chǎn)。
SUN微系統(tǒng)公司一直活躍在集群領(lǐng)域的前沿并不斷進(jìn)步。今年九月,公司獲取了Cluster File Systems大部分的知識產(chǎn)權(quán),包括Lustre File System。Lustre File System是一個針對大規(guī)模計算集群設(shè)計的文件系統(tǒng),包括在德克薩斯建立的星群系統(tǒng)(Constellation System)超級計算機(jī)。
評論