人工智能?自動駕駛?云計算?數(shù)據(jù)中心?10nm FPGA全程帶飛
CPU疲于應(yīng)對未來大數(shù)據(jù)運算
當(dāng)下時代的主題究竟是什么?5G通信?人工智能?自動駕駛?還是云計算?或許都是;又或許,都不是。當(dāng)你看到在這些前端應(yīng)用市場不斷迸發(fā)著激情和靈感時,如何滿足其背后以指數(shù)形式增長的數(shù)據(jù)需求就成了諸多工程師最為頭疼的問題。
有數(shù)據(jù)顯示,到2020年,平均每位互聯(lián)網(wǎng)用戶每天將會產(chǎn)生1.5GB數(shù)據(jù)流量,自動駕駛汽車每天將會產(chǎn)生4TB數(shù)據(jù)流量,聯(lián)網(wǎng)飛機每天將會產(chǎn)生5TB數(shù)據(jù)流量,智能工廠每天將會產(chǎn)生1PB數(shù)據(jù)流量,云視頻提供商每天將會生成750PB視頻類的數(shù)據(jù)流量。在聯(lián)網(wǎng)的世界里,數(shù)據(jù)量將會以指數(shù)形式增長。(1PB=1024TB)
目前,全世界有80億個終端聯(lián)網(wǎng),到2020年將會有500億個終端聯(lián)網(wǎng),與此同時,未來聯(lián)網(wǎng)設(shè)備將會需要更寬的帶寬。據(jù)思科預(yù)測,到2020年,聯(lián)網(wǎng)IP流量將會達到2300EB(1EB=1024PB)。這時,數(shù)據(jù)中心會與終端連接,形成一個良性循環(huán),而物聯(lián)網(wǎng)的發(fā)展將會加速這一循環(huán),使得網(wǎng)絡(luò)將必須在更高的速度上處理更多數(shù)據(jù),數(shù)據(jù)中心也需要做更復(fù)雜的計算,處理更大的數(shù)據(jù)級,嵌入式終端和設(shè)備也要做很多本地計算。另外,數(shù)據(jù)中心還需要應(yīng)對更多具有挑戰(zhàn)性的負載,例如大數(shù)據(jù)分析和機器學(xué)習(xí),這又將會在整個循環(huán)中產(chǎn)生很多數(shù)據(jù)瓶頸和計算熱點,這些都使得CPU無法單獨應(yīng)對。
如何解決這一難題呢?
FPGA:讓我來為計算加點料!!!
圖1 數(shù)據(jù)中心與終端設(shè)備的良性循環(huán)
FPGA:時代的推手
5G通信、物聯(lián)網(wǎng)、云計算、智慧城市、自動駕駛及雷達和航天是當(dāng)下最火爆的六大應(yīng)用市場,而由于這些應(yīng)用都涉及到海量的數(shù)據(jù)和高速的運算能力,每個市場都在面臨連接數(shù)量和計算復(fù)雜度的急速增長,單靠CPU已經(jīng)很難輕松拿下未來這場攻堅戰(zhàn)。而利用FPGA開發(fā)系統(tǒng)時,系統(tǒng)設(shè)計不會被鎖定,開發(fā)周期短,相比專用硬件具有更好的容錯性。因而,可以說FPGA的又一主場即將到來。
例如,在當(dāng)下熱點之一的無人駕駛領(lǐng)域,隨著無人駕駛的不斷發(fā)展,對性能將會有更高的要求,而在對算法應(yīng)用上也將會有很大的不確定性,因而會出現(xiàn)很多計算孤島,每一個孤島會有自己的本身硬件和開發(fā)環(huán)境,這對制造開發(fā)商來說是不可持續(xù)的。FPGA在以下兩個領(lǐng)域可以發(fā)揮關(guān)鍵作用:
1)本地計算。例如傳感器融合,深度學(xué)習(xí)推算這些都是要在汽車上本地實時進行。
2)安全可靠的5G連接。把汽車和其他車輛及云端實現(xiàn)連接。
在智慧城市領(lǐng)域,同樣,計算孤島也正在出現(xiàn),包括交通管理系統(tǒng)、照明管理系統(tǒng)、泊車管理系統(tǒng)和安全攝像頭,實際上都是各自為政的,眾多不同的系統(tǒng)由眾多不同的廠家來生產(chǎn),有不同架構(gòu)和開發(fā)環(huán)境,不同的系統(tǒng)之間無法實現(xiàn)數(shù)據(jù)共享,城市管理者無法實現(xiàn)對城市全面的了解。而CPU+FPGA實際上可以取代一些專有的架構(gòu),只需要通過加速幾個關(guān)鍵功能就可以提供本地計算、連接和分析能力。另外,也可以將眾多的孤島放到單一的英特爾架構(gòu)上,加上FPGA的環(huán)境及5G網(wǎng)絡(luò),從而降低開發(fā)成本和錯誤率,并使系統(tǒng)具備機器學(xué)習(xí)的能力,以應(yīng)對未來更加復(fù)雜的網(wǎng)絡(luò)環(huán)境和城市環(huán)境。
這些應(yīng)用都很好地說明了FPGA在加速良性循環(huán)方面的重要作用。
FPGA才是異構(gòu)計算的神助手
其實FPGA相當(dāng)于一個具有以下兩方面優(yōu)點先進的多功能加速器:
1) 擁有巨大的編程靈活性,支持高度差異化的產(chǎn)品;
2) 可以在現(xiàn)場重新配置,虛擬加速任何數(shù)字算法;
3) 支持并行運算;
4) 吞吐量、實時速度、能耗等性能相比CPU或GPU優(yōu)異10倍;
5) 低時延可以處理更多數(shù)據(jù)。
因此,F(xiàn)PGA是一種兼具硬件性能和軟件可編程能力的產(chǎn)品,對于異構(gòu)計算來說尤為重要。
FPGA在異構(gòu)計算中具體有兩種加速形式,即旁路加速和內(nèi)建加速。旁路加速可以將重度計算功能轉(zhuǎn)移到FPGA上,從而釋放處理器去處理其他功能;而如果時延比較重要,則可以進行內(nèi)建加速,從而通過FPGA的多功能性帶來更好的網(wǎng)絡(luò)存儲和計算的加速。另外,英特爾FPGA產(chǎn)品在包括數(shù)據(jù)庫加速、基因測序、存儲及云端已經(jīng)有具體的應(yīng)用和很好的效果。
圖2 FPGA在異構(gòu)計算中的兩種加速形式
10nm FPGA帶節(jié)奏
Altera并入英特爾并成為英特爾PSG事業(yè)部,獲得了英特爾領(lǐng)先業(yè)界三年的制程技術(shù),帶來更大的容量和更快的速度。最新的STRATIX?10高端芯片已經(jīng)有樣片,ARRIA?10產(chǎn)品已經(jīng)在全面生產(chǎn),而CYCLONE?10和MAX?10已經(jīng)可以大量出貨。
圖3 STRATIX?10/ARRIA?10/CYCLONE?10/MAX?10
下一代基于英特爾10nm制程的新FPGA產(chǎn)品——Falcon Mesa,使用英特爾10nm制程及世界最先進的FINFET技術(shù),也是第二代使用HyperFlexTM和基于EMIB異構(gòu)SIP(EMIB是英特爾的接口規(guī)范。)的產(chǎn)品。新產(chǎn)品會支持下一代HBM,轉(zhuǎn)換速率達112Gbps,還支持PCIe 4x16,從而可以支持16TB的大帶寬。
圖4 英特爾公司可編程解決方案事業(yè)部副總裁兼客戶體驗事業(yè)部總經(jīng)理Rina Raman
英特爾公司可編程解決方案事業(yè)部副總裁兼客戶體驗事業(yè)部總經(jīng)理Rina Raman稱,“這是Altera并入英特爾后第一代使用英特爾10nm制程技術(shù)開發(fā)出來的產(chǎn)品,我們將繼續(xù)推動摩爾定律的實現(xiàn),為業(yè)界帶來領(lǐng)先的性能和能效。”
評論