E級(jí)超算,2020年見(jiàn)
人類對(duì)宇宙探索的好奇心以及對(duì)問(wèn)題規(guī)模和精度的追求,決定了人們對(duì)超級(jí)計(jì)算能力的需求“不會(huì)止步”。在百P超算實(shí)現(xiàn)之后,E級(jí)超算,也就是百億億次超級(jí)計(jì)算機(jī),將成為世界各國(guó)爭(zhēng)奪的“下一頂皇冠”。
本文引用地址:http://cafeforensic.com/article/201607/293789.htm“新科”全球最快超級(jí)計(jì)算機(jī)“神威·太湖之光”亮相之后,全世界為之一震。“全球第一快”有多快?國(guó)家超級(jí)計(jì)算無(wú)錫中心主任楊廣文打了一個(gè)比方:“神威·太湖之光”1分鐘的計(jì)算能力,相當(dāng)于全球72億人同時(shí)用計(jì)算器不間斷計(jì)算32年。
這個(gè)速度就是93PFlops,浮點(diǎn)運(yùn)算速度每秒9.3億億次——人類歷史上第一次,將高性能計(jì)算機(jī)的運(yùn)轉(zhuǎn)速度記錄接近至每秒十億億次這個(gè)數(shù)量級(jí)。
然而,人類對(duì)超級(jí)計(jì)算機(jī)性能的追求沒(méi)有止境。“超算性能每提高1個(gè)數(shù)量級(jí),人類對(duì)它們的需求可能提高1000倍,也就是3個(gè)數(shù)量級(jí)。”中科院計(jì)算所研究員、中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專委會(huì)秘書長(zhǎng)張?jiān)迫诮邮堋吨袊?guó)科學(xué)報(bào)》記者采訪時(shí)說(shuō),人類對(duì)宇宙探索的好奇心以及對(duì)問(wèn)題規(guī)模和精度的追求,決定了人們對(duì)超級(jí)計(jì)算能力的需求“不會(huì)止步”。
“在百P超算實(shí)現(xiàn)之后,E級(jí)超算將成為世界各國(guó)爭(zhēng)奪的‘下一頂皇冠’,也就是百億億次超級(jí)計(jì)算機(jī)。”張?jiān)迫獙?duì)記者說(shuō)。
預(yù)計(jì)2020年左右實(shí)現(xiàn)
超算水平是一個(gè)國(guó)家綜合國(guó)力和科技創(chuàng)新能力的重要標(biāo)志,各國(guó)對(duì)E級(jí)超算的爭(zhēng)奪,無(wú)不摻雜著國(guó)家戰(zhàn)略的意味。
自“天河二號(hào)”于2013年11月正式登頂當(dāng)時(shí)的超算TOP500榜首之后,美國(guó)這個(gè)頭號(hào)超算強(qiáng)國(guó)已連續(xù)3年未曾染指這一寶座。然而,種種跡象表明,美國(guó)從未在“最快超算梯隊(duì)”上掉隊(duì)。
全球超算TOP500排行榜發(fā)起人、橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室及田納西大學(xué)教授杰克·唐加拉(JackDongarra)在接受《中國(guó)科學(xué)報(bào)》記者郵件采訪中說(shuō)道,美國(guó)能源部通過(guò)國(guó)家戰(zhàn)略計(jì)算計(jì)劃(NSCI)以及與產(chǎn)業(yè)界和學(xué)術(shù)界的合作,正在推行能進(jìn)行百億億次計(jì)算系統(tǒng)的開(kāi)發(fā)。“該系統(tǒng)集成了硬件和軟件能力,在一系列代表政府需求的應(yīng)用中的表現(xiàn)將是目前10千萬(wàn)億次系統(tǒng)的100倍。”
記者了解到,歐洲、日本也制定了自己的E級(jí)超算研發(fā)計(jì)劃,并將相應(yīng)計(jì)劃的完成時(shí)間表設(shè)定在了2020年。
張?jiān)迫嘎叮袊?guó)也將百億億次超級(jí)計(jì)算機(jī)及相關(guān)技術(shù)的研究寫入了國(guó)家“十三五”規(guī)劃,同時(shí)也希望在2020年左右實(shí)現(xiàn)這一宏偉研究計(jì)劃。出人意料的,在幾個(gè)制定了相關(guān)計(jì)劃的國(guó)家中,只有美國(guó)相對(duì)“悲觀”,他們預(yù)計(jì)百億億次超級(jí)計(jì)算機(jī)的建成或許需要到2022年。
業(yè)內(nèi)人士認(rèn)為,美國(guó)此舉或許并非故弄玄虛,因?yàn)殡S著高性能計(jì)算機(jī)運(yùn)算規(guī)模的增加,建造它的難度可能將是幾何級(jí)數(shù)的提升。
E級(jí)超算的挑戰(zhàn)
張?jiān)迫嬖V記者,百億億次超級(jí)計(jì)算機(jī)的建造難度并不僅僅在于速度的提升,更在于對(duì)大規(guī)模超算設(shè)備的功耗要求。按照由美國(guó)倡導(dǎo)的國(guó)際公認(rèn)標(biāo)準(zhǔn),E級(jí)超算的功耗應(yīng)低于20MW。按照這一功耗目標(biāo)要求,未來(lái)的E級(jí)超級(jí)計(jì)算機(jī)的能效比要達(dá)到50GFlops/W。
這在張?jiān)迫磥?lái),是一堵難以逾越的高墻,畢竟排在Green500第三位、創(chuàng)造了大規(guī)模高性能計(jì)算機(jī)效能比的最好成績(jī)的“神威·太湖之光”每瓦性能只有6GFlops,仍相差一個(gè)數(shù)量級(jí)。
“功耗墻很難逾越,是各國(guó)都在面臨的難題。”張?jiān)迫獙?duì)記者說(shuō):“現(xiàn)在大家希望采用異構(gòu)加速或異構(gòu)綜合的方式來(lái)降低功耗的要求,但由此帶來(lái)的是編程的困難。因此,可以說(shuō)研發(fā)E級(jí)超算實(shí)際上面臨著編程墻、功耗墻、可靠性墻和存儲(chǔ)墻幾個(gè)‘大墻’的圍堵,如何越過(guò)這幾堵墻,面臨很大的挑戰(zhàn)。”
在被問(wèn)及這一問(wèn)題時(shí),杰克·唐加拉給記者列出了一份“沒(méi)有特定順序”的百億億次計(jì)算實(shí)現(xiàn)之前的“TOP10挑戰(zhàn)”名單,具體地描繪出了實(shí)現(xiàn)百億億次超級(jí)計(jì)算機(jī)之路上“攔路虎”的樣子。
在這份名單里,關(guān)乎計(jì)算性能的挑戰(zhàn)有2個(gè),分別是研發(fā)更節(jié)能的電路、電源和冷卻技術(shù)和增加數(shù)據(jù)流動(dòng)的性能和能量效率;關(guān)乎計(jì)算硬件的更新升級(jí)的只有1個(gè):集成先進(jìn)的內(nèi)存技術(shù)以提高容量和帶寬;而關(guān)乎軟件和開(kāi)發(fā)環(huán)境方面的挑戰(zhàn)則有不少,分別是開(kāi)發(fā)可擴(kuò)展更強(qiáng)的系統(tǒng)軟件、發(fā)明適于大規(guī)模并行處理的新的編程環(huán)境、創(chuàng)建更優(yōu)化的數(shù)據(jù)管理軟件等。在這份列表中,杰克·唐加拉還提醒計(jì)算科學(xué)家們需要從系統(tǒng)或更高角度準(zhǔn)備迎接E級(jí)計(jì)算的挑戰(zhàn),比如要重塑百億億次超算系統(tǒng)對(duì)科學(xué)問(wèn)題的解決方案、提高用新的軟件工具和環(huán)境的生產(chǎn)力、確保E級(jí)超算發(fā)生故障時(shí)科學(xué)計(jì)算的重現(xiàn)性等。
“E級(jí)應(yīng)用”
“每秒執(zhí)行百億億次計(jì)算,這可是我們今天所見(jiàn)機(jī)器計(jì)算速度的數(shù)十上百倍,這些未來(lái)的計(jì)算機(jī)將是一個(gè)全新的‘物種’。而且,它們不僅在于快,更在于它們可以以全新的方式處理大數(shù)據(jù)。”杰克·唐加拉說(shuō),“這將是非常必要的,E級(jí)超算未來(lái)將非常有用,比如它們或許能攻克癌癥。”
“為了找到治療癌癥的方法,我們需要找出以前沒(méi)有見(jiàn)過(guò)的模式。”杰克·唐加拉說(shuō),在癌癥治療方面,人們面臨的挑戰(zhàn)不是缺乏相關(guān)數(shù)據(jù)——現(xiàn)在比以往更多,而是如何“打開(kāi)”這些數(shù)據(jù),并找到合理的模式處理它,從而告訴人們到底是什么原因?qū)е掳┌Y或者如何更有效地對(duì)抗它。“超級(jí)計(jì)算機(jī)是用于分析基因組和相關(guān)分子數(shù)據(jù)集、患者記錄、家族史和與癌癥相關(guān)的其他復(fù)雜信息優(yōu)良的工具。隨著超級(jí)計(jì)算機(jī)的發(fā)展,我相信我們可以找到答案。”
張?jiān)迫仓赋?,E級(jí)超算如此受“歡迎”,正在于它在解決人類共同面臨的健康危機(jī)、能源危機(jī)、環(huán)境污染和氣候變化等重大問(wèn)題上將發(fā)揮巨大作用。“從目前來(lái)看,E級(jí)超算主要面對(duì)一些具有重大計(jì)算的需求,如全球氣候變化模擬、天體物理大數(shù)據(jù)的處理、模擬宇宙的演化、新型材料驗(yàn)證及無(wú)庫(kù)存核武器仿真等。”
此外,杰克·唐加拉指出,百億億次計(jì)算設(shè)備除對(duì)各個(gè)產(chǎn)業(yè)領(lǐng)域提速換擋有貢獻(xiàn)、提高國(guó)家競(jìng)爭(zhēng)力之外,還將“向下流動(dòng)”促進(jìn)產(chǎn)業(yè)發(fā)展,比如增強(qiáng)包括從智能手機(jī)到相機(jī)在內(nèi)的消費(fèi)電子產(chǎn)品計(jì)算系統(tǒng)的軟硬件性能等。
自主實(shí)現(xiàn)的曙光
在“神威·太湖之光”以自主芯片和操作系統(tǒng)獲得接近十億億次的計(jì)算速度之后,中國(guó)看到了自主研發(fā)E級(jí)超算的希望和曙光。張?jiān)迫J(rèn)為,“神威·太湖之光”的成功已經(jīng)為我國(guó)向E級(jí)超算邁進(jìn)打下了一個(gè)堅(jiān)實(shí)的基礎(chǔ),只要做好人才、資源、經(jīng)費(fèi)和材料的儲(chǔ)備,沖擊E級(jí)超算指日可待。
按照一般科研規(guī)律,在類似大科學(xué)裝置正式進(jìn)入研發(fā)日程之前,原型系統(tǒng)等預(yù)研項(xiàng)目非常必要。
“從原型系統(tǒng)到大規(guī)模系統(tǒng),難度是幾何倍數(shù)增加的。所以原型系統(tǒng)不可能暴露所有的問(wèn)題。”張?jiān)迫f(shuō),但預(yù)研項(xiàng)目可以驗(yàn)證一些關(guān)鍵的技術(shù)設(shè)想,對(duì)一些關(guān)鍵技術(shù)難點(diǎn)進(jìn)行測(cè)試和改進(jìn),“為最后建造全部的系統(tǒng)來(lái)掃清障礙,避免出現(xiàn)大的技術(shù)錯(cuò)誤和難題。”
在最新公布的國(guó)家“十三五”高性能計(jì)算專項(xiàng)課題中可以看到,我國(guó)公示出了三個(gè)分別由中科曙光、國(guó)防科技大學(xué)以及江南計(jì)算技術(shù)研究所牽頭的E級(jí)超算的原型系統(tǒng)研制項(xiàng)目。據(jù)消息人士透露,中科曙光牽頭的E級(jí)超算原型系統(tǒng)研制項(xiàng)目將于近期舉行的曙光技術(shù)創(chuàng)新大會(huì)(IDIC2016)上正式啟動(dòng)。
“我們國(guó)家發(fā)展E級(jí)超算是‘三頭并進(jìn)’——這下代表著中國(guó)超算“三足鼎立”——三家單位在超算技術(shù)領(lǐng)域均具有強(qiáng)大的研發(fā)實(shí)力。”張?jiān)迫嬖V記者,我國(guó)在E級(jí)超算研制方面采取的是競(jìng)爭(zhēng)機(jī)制,預(yù)計(jì)兩年之后會(huì)對(duì)三家單位進(jìn)行評(píng)估,最后吸取最好的方案來(lái)整合成最后國(guó)家的E級(jí)超算研發(fā)體系。
評(píng)論