數(shù)據(jù)中心加速器芯片年增50%,Achoronix聯(lián)手BittWare推出FPGA加速卡
數(shù)據(jù)中心加速器的芯片市場預(yù)測
本文引用地址:http://cafeforensic.com/article/201911/406845.htm數(shù)據(jù)中心市場的加速芯片主要包括CPU、GPU、FPGA和ASIC等。據(jù)Semico Research于2019年5月的預(yù)測,從2018年到2023年的5年間,數(shù)據(jù)中心加速器市場預(yù)計(jì)將從28.4億美元增長211.9億美元,年均增長率為49.47%。其中,FPGA預(yù)計(jì)將是年均增長率最高的細(xì)分市場(如下圖),該增長將由企業(yè)級(jí)工作負(fù)載加速應(yīng)用驅(qū)動(dòng)。
數(shù)據(jù)加速可以分成計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)三大類。有一部分是GPU可以做的,但是另外很大一部分更適合于用FPGA來做加速。
業(yè)界普遍認(rèn)為的性能對(duì)比顯示,相比于傳統(tǒng)CPU,F(xiàn)PGA提升的性能是10~100倍,倍數(shù)變化主要來自不同的應(yīng)用。不僅如此,在提高性能的同時(shí),F(xiàn)PGA的功耗也會(huì)大幅降低。
從市場上來看,這幾年FPGA加速卡的應(yīng)用越來越多。從下圖右可以看出,F(xiàn)PGA加速卡和服務(wù)器是新的技術(shù),目前正處于上升期。
業(yè)界的Tier 1客戶,諸如亞馬遜和微軟的數(shù)據(jù)中心在二三年前就已經(jīng)把FPGA加速方案用到他們的數(shù)據(jù)中心。只不過因?yàn)樗麄兪荰ier 1,工程師資源和軟件都有雄厚的實(shí)力,所以可以把芯片直接做進(jìn)服務(wù)器主板里,即嵌入到他們的硬件系統(tǒng)中。但是對(duì)于很多Tier 2和Tier 3的OEM(生產(chǎn)商),或一些小型的數(shù)據(jù)中心及純做軟件的客戶,并不具備這樣的工程資源,所以可以通過采購基于標(biāo)準(zhǔn)的PCIe接口的FPGA加速卡,快速地部署到自己的業(yè)務(wù)和應(yīng)用中。
數(shù)據(jù)中心部署FPGA加速方案有很多好處。①效率方面,F(xiàn)PGA相對(duì)于GPU和CPU有更高的能效比。②FPGA可以根據(jù)客戶的特殊需求重新配置。③FPGA加速卡可以快速部署,使客戶的實(shí)驗(yàn)室應(yīng)用快速地推向市場,而無需把更多的精力和資源放在底層的開發(fā)上。④對(duì)于hyperscaler(超大規(guī)模廠商),也可以做大規(guī)模的部署。
采用Speedster7t獨(dú)立FPGA芯片的VectorPath加速卡
2019年10月,基于FPGA的數(shù)據(jù)加速器件和高性能嵌入式FPGA(eFPGA)半導(dǎo)體知識(shí)產(chǎn)權(quán)(IP)的領(lǐng)導(dǎo)性企業(yè)Achronix半導(dǎo)體公司,與Molex旗下的一家領(lǐng)先企業(yè)級(jí)FPGA加速器產(chǎn)品供應(yīng)商BittWare聯(lián)合宣布:推出面向高性能計(jì)算和數(shù)據(jù)加速應(yīng)用的FPGA加速卡。
新推出的VectorPath S7t-VG6加速卡搭載了Achronix采用7nm工藝打造的Speedster7tAC7t1500獨(dú)立FPGA芯片,它在同類PCIe FPGA加速卡中,提供了目前業(yè)界最高性能的接口。這些高性能接口包括1x400GbE和2x100GbE接口,以及總帶寬為4Tbps的8組GDDR6的板上存儲(chǔ)器,使該加速卡成為高帶寬數(shù)據(jù)加速應(yīng)用的理想選擇。
為此,Achronix市場營銷副總裁Steve Mensor和Molex副總裁Sam Bichara向電子產(chǎn)品世界記者介紹了其特色。
圖 從左至右:Achronix市場營銷副總裁Steve Mensor,Molex副總裁Sam Bichara
VectorPath加速卡是基于Achronix新一代的7t的高性能,針對(duì)高帶寬優(yōu)化的一個(gè)FPGA。優(yōu)勢有兩點(diǎn):①二維的高速片上網(wǎng)絡(luò),②針對(duì)人工智能、機(jī)器學(xué)習(xí)優(yōu)化的MLR單元(如下圖)。
因此,數(shù)據(jù)中心開發(fā)人員可以不用關(guān)注硬件,只要采用現(xiàn)成可用的硬件,加上自己的軟件、算法就可實(shí)現(xiàn)應(yīng)用,這樣就可以大大加速部署和開發(fā)。
Achronix的合作伙伴BittWare非常有實(shí)力:有約30年的FPGA加速卡的設(shè)計(jì)和生產(chǎn)制造經(jīng)驗(yàn),于2018年被Molex收購,成為更大規(guī)模公司——Molex的子公司,可以充分利用Molex更廣闊的技術(shù)支持和銷售團(tuán)隊(duì)服務(wù)客戶。
VetcorPath加速卡所具有的功能
VectorPath加速卡系專為高性能和高帶寬數(shù)據(jù)應(yīng)用而設(shè)計(jì),具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8組GDDR6存儲(chǔ)器可提供4 Tbps的總帶寬;1組帶有錯(cuò)誤檢查和糾正(ECC)功能的、運(yùn)行頻率為2666MHz的DDR4存儲(chǔ)器;Speedster7t FPGA芯片集成了帶寬為20 Tbps的二維片上網(wǎng)絡(luò)(NoC);692K的6輸入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于連接擴(kuò)展卡的4通道PCIe Gen 4連接器。
VectorPath加速卡包括一整套Achronix的ACE開發(fā)工具,以及BittWare的基板管理控制器和開發(fā)工具包,其中包括API、PCIe驅(qū)動(dòng)程序、診斷自測和應(yīng)用示例設(shè)計(jì),以提供快速的、開箱即用的體驗(yàn)。
TeraBox FPGA服務(wù)器
TeraBox是基于FPGA的服務(wù)器(如下圖)。在過去BittWare注意到,客戶在買獨(dú)立的FPGA芯片,或者是基于FPGA板卡的加速卡時(shí),獨(dú)立的板卡放在服務(wù)器中進(jìn)行設(shè)計(jì),但是對(duì)于很多Tier 2、Tier 3甚至更小的客戶,沒有時(shí)間、精力以及工程資源去把FPGA卡給集成到服務(wù)器中,因此有一部分客戶需要更高的集成,這樣客戶只需簡單的配置就可以應(yīng)用起來。
TeraBox主要有兩大類客戶,一類是有特殊需求的客戶,他需要把上層軟件快速部署到業(yè)務(wù)中,或客戶需要快速地去展示他們的軟件。另一類是對(duì)于一些IT經(jīng)理,他的技術(shù)水準(zhǔn)不是那么深,因此無需關(guān)注底層,還可以降低風(fēng)險(xiǎn),同時(shí)可以簡單部署,縮短整個(gè)業(yè)務(wù)的上線時(shí)間。
采購TeraBox的另一優(yōu)勢是:傳統(tǒng)的FPGA加速卡,一般只提供一年的質(zhì)保和技術(shù)服務(wù),但是服務(wù)器一般是3年。
與競品的差異化
除了Achronix之外,另外兩大FPGA廠商此前已推出了加速卡;2019年下半年,兩大FPGA廠商忙于發(fā)布各自的“統(tǒng)一軟件開發(fā)平臺(tái)”,Achronix有類似的軟件平臺(tái)產(chǎn)品嗎?
實(shí)際上,競品的芯片不僅有FPGA、處理器(Arm SoC),還有另外的處理器(例如AI引擎)等。例如AI引擎,X公司的AI引擎底層是Synopsys公司的矢量處理器,但是這種矢量處理器跟Arm CPU是不同架構(gòu)的處理器,再加上外部的高速接口,客戶要面對(duì)3種不同的硬件底層。
“統(tǒng)一軟件平臺(tái)”從表面上看是用同一個(gè)軟件的思維去開發(fā),但是作為開發(fā)者,處理數(shù)據(jù)時(shí)要考慮哪部分放在FPGA里,哪部分放在CPU里,哪部分放在AI引擎/矢量處理器;另外要考慮互相之間的數(shù)據(jù)怎樣去流動(dòng),而不是只是簡單的有一個(gè)工具讓你去用。因此,怎樣讓設(shè)計(jì)者很好地利用你的架構(gòu),對(duì)于軟件工程師是非常有挑戰(zhàn)的。
對(duì)于Achronix而言,走的是另外一個(gè)方向:對(duì)傳統(tǒng)的FPGA做了很多優(yōu)化,諸如二維的高速網(wǎng)絡(luò);另外,為了提高算力,雖然名字叫機(jī)器學(xué)習(xí)處理器(MLP),但它不是處理器,它實(shí)際上最底層是一種乘累加陣列(MAC,如下圖),是硬件。所以所有底層的思維還是硬件的思維。
圖 MLP架構(gòu):專為計(jì)算密集的人工智能/機(jī)器學(xué)習(xí)(AI/ML)應(yīng)用而優(yōu)化的Speedster7t
當(dāng)然Achronix也有開發(fā)工具,但是整個(gè)底層架構(gòu)是硬件架構(gòu),沒有不同類型的單元。Achronix的開發(fā)思路是讓原有的FPGA工程師很容易地去用Achronix的平臺(tái),而且Achronix的平臺(tái)性能有大幅的提升,甚至軟件工程師通過Achronix的工具也可以很容易去用這個(gè)硬件平臺(tái)。
總之,Achronix的思路是延續(xù)傳統(tǒng)模式,在傳統(tǒng)模式上做進(jìn)一步的優(yōu)化。即硬件軟件化——有很容易用起來的硬件,好像用軟件一樣。例如Speedster7t的二維片上網(wǎng)絡(luò)(如下圖),讓整個(gè)的硬件的設(shè)計(jì),更像軟件的思維去做。
另外,關(guān)于競品的加速卡,例如I公司,采用的存儲(chǔ)是HBM2,而Achronix采用的是GDDR6,特點(diǎn)是速度快,同時(shí)價(jià)格便宜(相對(duì)于目前業(yè)界通用的HBM2,價(jià)格會(huì)便宜很多),而且HBM2實(shí)現(xiàn)起來也比較復(fù)雜,需要封裝到FPGA上,制造也比較困難。
上市時(shí)間和售價(jià)
VectorPath現(xiàn)在就可以接受訂單,預(yù)計(jì)在2020年第2季度發(fā)貨到客戶。在客戶拿到這個(gè)加速卡之前,客戶現(xiàn)在就可以開始做開發(fā)。加速卡的價(jià)格是7500美元。
總結(jié)
對(duì)于數(shù)據(jù)中心、邊緣計(jì)算等需要計(jì)算加速的領(lǐng)域,整個(gè)硬件加速市場正在快速增長,CPU已經(jīng)趕不上性能的需求,F(xiàn)PGA是一種高效選擇。
除了極少數(shù)超大數(shù)據(jù)中心有能力和用量可支撐自己建立FPGA團(tuán)隊(duì),包括硬件團(tuán)隊(duì)去開發(fā)加速卡以外,絕大部分的Tier 2或Tier 3需要去外部采購加速卡,包括相應(yīng)的底層軟件。因此,F(xiàn)PGA廠商紛紛祭出FPGA加速卡。Achronix和BittWare聯(lián)手推出了采用Speedster7t獨(dú)立FPGA芯片的VectorPath加速卡,可以快速部署,簡單易用。相比競品,VectorPath還具有超高性能的特點(diǎn)。
評(píng)論