高性能計(jì)算的金字塔式進(jìn)化
剛剛更新的HPC TOP500榜單再次點(diǎn)燃了人們的激情。對(duì)專業(yè)人士來(lái)說,這份來(lái)自國(guó)際超級(jí)計(jì)算大會(huì)的權(quán)威成果預(yù)示著高性能計(jì)算的新風(fēng)向。即便是普通讀者,這份榜單也絕非無(wú)關(guān)緊要,計(jì)算能力躍升意味著我們能更快地找到石油、更準(zhǔn)確地預(yù)測(cè)天氣和自然災(zāi)害、更清楚地了解生命的奧秘……
本文引用地址:http://cafeforensic.com/article/85514.htm從科研向商用普及
相較以往,此次公布的榜單似乎動(dòng)靜更大些。這半年來(lái),計(jì)算能力再上了一個(gè)數(shù)量級(jí),考量依據(jù)首次引入能效數(shù)據(jù)、四核快速成為絕對(duì)主流,集群、Infiniband等技術(shù)主題詞的優(yōu)勢(shì)也進(jìn)一步擴(kuò)大,英特爾更是以其IA架構(gòu)(至強(qiáng)與安騰)占據(jù)75%的份額理所當(dāng)然地拔得頭籌。眾多表象背后,我們?cè)噲D聚焦于平臺(tái)及生態(tài)系統(tǒng)層面,榜單背后還有哪些值得我們?nèi)リP(guān)注?
高性能市場(chǎng)是典型的金字塔結(jié)構(gòu),最下端的基石部分是龐大的工作組級(jí),系統(tǒng)一般為6~64個(gè)節(jié)點(diǎn),中間部分就是所謂的行業(yè)大單,一般有256~512個(gè)節(jié)點(diǎn),甚至更大。頂部技術(shù)最尖端,也最吸引眼球,它一定是大規(guī)模并行架構(gòu)方面的創(chuàng)新者和推動(dòng)者,但份額極小。
英特爾服務(wù)器產(chǎn)品經(jīng)理顧凡表示,高性能計(jì)算市場(chǎng)的熱點(diǎn)集中在兩端,一個(gè)是頂端的技術(shù)突破,擁有更大的計(jì)算能力去滿足尖端領(lǐng)域的性能需求;另一個(gè)是底端的應(yīng)用普及,它的關(guān)鍵在于提供商要能把突破性技術(shù)以更低的成本向下灌輸。金字塔的中間部分是最為成熟的,標(biāo)準(zhǔn)化的集群架構(gòu)非常普及且標(biāo)準(zhǔn)化,未來(lái)只是應(yīng)用刀片解決方案之類的提高能效的問題。
從對(duì)上榜系統(tǒng)用戶的統(tǒng)計(jì)上看,HPC從科研走向商用化的趨勢(shì)非常明顯,關(guān)注點(diǎn)也由過去的追求性能到解決問題的高生產(chǎn)力。以中國(guó)為例,我國(guó)內(nèi)地上榜的12套系統(tǒng)中有6套用于石油行業(yè)的勘探作業(yè)。另6套高性能計(jì)算系統(tǒng)分別為電信、氣象、地理和物流等行業(yè)用戶采用。相比全球發(fā)展來(lái)看,中國(guó)目前仍有多個(gè)行業(yè)尚未開啟其高性能進(jìn)程,如金融行業(yè),華爾街在其風(fēng)險(xiǎn)模型的預(yù)測(cè)方面應(yīng)用高性能計(jì)算,在做投資產(chǎn)品組合時(shí)快速響應(yīng),降低風(fēng)險(xiǎn),搶占先機(jī);再比如生命科學(xué)領(lǐng)域,高性能計(jì)算也在高速成長(zhǎng)。這些都是中國(guó)亟待開墾的高性能計(jì)算沃土。
軟硬件的協(xié)同力量
此次TOP500上榜系統(tǒng)的總體計(jì)算能力獲得了空前提升,本次榜單中排名最后的系統(tǒng)性能在上一次榜單公布中還可以名列第200名。這樣的性能提升與采用多核處理器密不可分。
在系統(tǒng)采用的處理器中,剛發(fā)布7個(gè)月的英特爾至強(qiáng)5400是最耀眼的明星,它同時(shí)也推動(dòng)了四核成為HPC的絕對(duì)主流。至強(qiáng)5400被161臺(tái)系統(tǒng)采用,占總數(shù)的32.20%,同時(shí),在首次引入的能效考量體系中,也以最高為265Mflop/s/W的表現(xiàn)位居x86架構(gòu)系統(tǒng)的首位。這樣的表現(xiàn)主要?dú)w功于45nm制造工藝給其絕對(duì)性能和能效帶來(lái)的提升。顧凡表示,待Nehalem微架構(gòu)推出,內(nèi)存帶寬等方面的改善將使基于該架構(gòu)處理器的系統(tǒng)獲得更大的性能提升,能效也將進(jìn)一步提高。
有了先進(jìn)的處理器,性能卻未必一定會(huì)提升很高,因?yàn)檐浖线€存在著巨大的調(diào)優(yōu)空間。英特爾在HPC生態(tài)系統(tǒng)中,就從事著這樣的軟件支持工作。其實(shí),軟件與硬件可謂英特爾的左右手,它在軟件方面有大量調(diào)試工具,針對(duì)高性能計(jì)算有專門的軟件包,如編譯器、數(shù)學(xué)函數(shù)庫(kù)等工具,這些是幫用戶把高性能計(jì)算應(yīng)用好的核心。英特爾所做的工作就是針對(duì)用戶的應(yīng)用軟件做優(yōu)化,解決并行瓶頸,以更好地應(yīng)用線程并行,這樣才能把整個(gè)集群的能力激發(fā)出來(lái),甚至?xí)岣邤?shù)倍的整體性能。
記者了解到,英特爾設(shè)在美國(guó)的高性能計(jì)算中心由軟件與解決方案事業(yè)部管理,其職責(zé)是幫助HPC解決方案供應(yīng)商、甚至最終用戶做分析與調(diào)優(yōu),他們最早接觸英特爾的高性能產(chǎn)品,有足夠的技術(shù)實(shí)力在新一代架構(gòu)上進(jìn)行調(diào)優(yōu)。
蓄勢(shì)千萬(wàn)億數(shù)量級(jí)
IBM基于CELL和皓龍?zhí)幚砥鞯腞oadrunner此次位列榜首,并將計(jì)算數(shù)量級(jí)突破了千萬(wàn)億次(1 Petaflops)。同樣是沖擊最高端,英特爾的產(chǎn)品規(guī)劃與技術(shù)準(zhǔn)備的情況如何?混合架構(gòu)是否是沖擊千萬(wàn)億次計(jì)算的必經(jīng)之路?
英特爾高性能計(jì)算方案架構(gòu)師張曉軍與記者進(jìn)行了交流。他認(rèn)為,在最高端領(lǐng)域,英特爾正穩(wěn)步走在正確軌道上。“英特爾在高性能計(jì)算產(chǎn)品線上的布局非常完整,既有服務(wù)于集群架構(gòu)的至強(qiáng),也有服務(wù)于大內(nèi)存容量需求的安騰,未來(lái)高端的還有Many Core(眾核)架構(gòu)去服務(wù)HPC的金字塔尖部分。”他列舉了兩個(gè)重要事件佐證觀點(diǎn),一是4月28日,Cray宣布聯(lián)合英特爾共同開發(fā)下一代高性能計(jì)算機(jī);二是NASA(美國(guó)航空航天管理局)與英特爾、SGI宣布將共同為NASA在2009年前開發(fā)出峰值性能為千萬(wàn)億次的計(jì)算系統(tǒng),2012年將這一數(shù)字提高到萬(wàn)萬(wàn)億次,服務(wù)于NASA航空航天的研究包括氣象預(yù)測(cè)的研究。“這些重量級(jí)的合作伙伴為什么會(huì)選擇與英特爾長(zhǎng)期合作?這表明他們看到并認(rèn)可英特爾在HPC領(lǐng)域未來(lái)長(zhǎng)遠(yuǎn)的發(fā)展藍(lán)圖。” 張曉軍表示。
在技術(shù)層面,英特爾2006年就開始做單芯片的萬(wàn)億次研究,它將成為千萬(wàn)億次計(jì)算的基石組件。張曉軍介紹說,英特爾已為此開展了100多個(gè)研究項(xiàng)目,去探索在未來(lái)的超大規(guī)模并行計(jì)算中,除了處理器之外,在服務(wù)器平臺(tái)、內(nèi)存架構(gòu)、高帶寬I/O、軟件編程等各個(gè)方面遇到的難題,都以研究項(xiàng)目覆蓋解決。“英特爾堅(jiān)信,高性能計(jì)算一定會(huì)走向多核化,我們更傾向于未來(lái)更輕量的小核實(shí)現(xiàn)并行化,這個(gè)核的指令集、計(jì)算、管道都不用那么復(fù)雜,這也會(huì)帶來(lái)能量節(jié)省。”
談及混合架構(gòu),張曉軍認(rèn)為,加速器盡管對(duì)性能提升的影響較大,但卻只適用于應(yīng)用的特定部分,對(duì)其他部分意義并不大。而對(duì)于大多數(shù)用戶的實(shí)際應(yīng)用來(lái)說,他們首先要考慮軟件調(diào)優(yōu)帶來(lái)的大幅度性能提升,這才具有更為普遍的意義。張曉軍表示,輕量小核才是未來(lái)的必經(jīng)之路。“當(dāng)然,只靠多核也不能走向千萬(wàn)億次,還需要有能力做平臺(tái)研發(fā)和軟件方面的嘗試和突破,這正是英特爾的核心價(jià)值所在。”
評(píng)論