色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動態(tài) > 英特爾：下一代DNN到來時未來FPGA能將敗GPU

英特爾：下一代DNN到來時未來FPGA能將敗GPU

作者：時間：2017-03-24 來源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

編者按：當下一代DNN到來時，F(xiàn)PGA的表現(xiàn)能否擊敗GPU?英特爾對比兩代FPGA以及最新的TITAN X GPU，結(jié)果顯示目前DNN算法的趨勢可能有利于FPGA。

　　在最近的FPGA國際研討會(ISFPGA)上，英特爾加速器架構(gòu)實驗室(AAL)的Eriko Nurvitadhi博士，發(fā)表題為《Can FPGAs beat GPUs in Accelerating Next-Generation Deep Neural Networks》的報告，分享了英特爾的最新研究。

本文引用地址：http://cafeforensic.com/article/201703/345681.htm

　　這一研究，主要評估在DNN(深度神經(jīng)網(wǎng)絡(luò))算法領(lǐng)域，兩代英特爾FPGA(Intel Arria10和Intel Stratix 10)，與NVIDIA TITAN X Pascal GPU相比性能如何。

英特爾：下一代DNN到來時未來FPGA能將敗GPU

　　△ 深度神經(jīng)網(wǎng)絡(luò)概述

　　英特爾表示在應(yīng)用領(lǐng)域，F(xiàn)PGA在DNN研究中表現(xiàn)非常出色，可用于需要分析大量數(shù)據(jù)的AI、大數(shù)據(jù)或機器學習等領(lǐng)域。使用經(jīng)修剪或緊湊的數(shù)據(jù)類型與全32位浮點數(shù)據(jù)(FP32)時，測試的Intel Stratix 10 FPGA的性能優(yōu)于GPU。

　　除了性能外，F(xiàn)PGA還具有強大的功能，因為它們具有適應(yīng)性，通過重用現(xiàn)有的芯片可以輕松實現(xiàn)更改，從而讓團隊在六個月內(nèi)從一個想法進入原型。

　　而構(gòu)建一個ASIC需要18個月。

　　FPGA重要性正在提升

英特爾：下一代DNN到來時未來FPGA能將敗GPU

　　△ FPGA非常適用于DNN

　　硬件：與高端GPU相比，F(xiàn)PGA具有卓越的能源效率(性能/瓦特)，但還有不被熟知的高峰值浮點性能。FPGA技術(shù)正在迅速發(fā)展。即將推出的英特爾Stratix 10 FPGA提供超過5，000個硬件浮點單元(DSP)，超過28MB的片上RAM(M20K)，與高帶寬內(nèi)存等特性。

　　基于14nm工藝的英特爾Stratix 10在FP32吞吐量方面達到峰值9.2TFLOP/s。相比之下，最新的Titan X Pascal GPU的FP32吞吐量為11TFLOP/s。

　　新興的DNN算法：更深的網(wǎng)絡(luò)提高了精度，但是大大增加了參數(shù)和模型大小。這增加了對計算、帶寬和存儲的需求。因此，新興趨勢是采用緊湊型低精度數(shù)據(jù)類型，遠低于32位。16位和8位數(shù)據(jù)類型正在成為新常態(tài)，也得到DNN軟件框架(例如TensorFlow)的支持。

　　新興的低精度和稀疏DNN算法比傳統(tǒng)的密集FP32 DNN提供了數(shù)量級的算法效率改進，但是它們引入了難以處理的不規(guī)則并行度和定制數(shù)據(jù)類型。這時FPGA的優(yōu)勢就體現(xiàn)出來了。這種趨勢使未來FPGA成為運行DNN，AI和ML應(yīng)用的可行平臺。

　　研究所用的硬件和方法

英特爾：下一代DNN到來時未來FPGA能將敗GPU

　　GPU：使用已知的庫(cuBLAS)或框架(Torch with cuDNN)

　　FPGA：使用Quartus Early Beta版本和PowerPlay

　　研究一：矩陣乘法(GEMM)測試

英特爾：下一代DNN到來時未來FPGA能將敗GPU

　　矩陣乘法(GEMM)測試的結(jié)果。GEMM是DNN中的關(guān)鍵操作，上述四個不同類型的測試表明，除了在FP32 Dense GEMM測試中，Stratix 10與TITAN X仍有差距。另外三項測試中新一代英特爾FPGA的表現(xiàn)都優(yōu)于GPU。

　　研究二：使用三元ResNet DNNs測試

英特爾：下一代DNN到來時未來FPGA能將敗GPU

　　三進制DNN最近提出約束神經(jīng)網(wǎng)絡(luò)權(quán)重為+1，0或-1。這允許稀疏的2位權(quán)重，并用符號位操作代替乘法。與許多其他低精度和稀疏的DNN不同，三元DNN可以提供與現(xiàn)有技術(shù)DNN(即ResNet)相當?shù)木取?/p>

　　上圖右半部分，顯示了英特爾Stratix 10 FPGA和TITAN X GPU的ResNet-50的性能和性能/功耗比。即使對于保守的性能估計，英特爾Stratix 10 FPGA已經(jīng)比實現(xiàn)了TITAN X GPU性能提高了約60%。在性能/功耗比方面，英特爾Stratix 10比TITAN X要好2.3倍到4.3倍。

　　結(jié)論

　　再說一次，這個研究報告出自英特爾，這個研究團隊還指出，除了DNN之外，F(xiàn)PGA在其他不規(guī)則應(yīng)用程序以及延遲敏感程序(如ADAS)等領(lǐng)域也有機會。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英特爾 FPGA

評論

相關(guān)推薦

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

英特爾承認13、14代處理器問題大將推出修補程序

消費電子英特爾處理器修補程序 | 2024-07-24

拓無線市場英特爾啟動PCA無線手持設(shè)備設(shè)計協(xié)作計劃

hpnet | 2002-11-05

家中處處都有英特爾”--英特爾稱要讓芯片無所不在

hpnet | 2002-10-25

FPGA如何同DDR3存儲器進行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

3-DES算法的FPGA高速實現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

消息稱臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

英特爾、三星后，又一廠商或跟進玻璃基板技術(shù)

EDA/PCB 英特爾、三星后，又一廠商或跟進玻璃基板技術(shù) | 2024-07-16

實時的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

英特爾56周年：從硅谷走向AI時代

智能計算英特爾硅谷 AI | 2024-07-19

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

PC產(chǎn)業(yè)已跌無可跌 AMD /英特爾季報均未達預期

hpnet | 2002-10-17

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

智能計算英特爾 AI解決方案 Meta Llama 3.1 | 2024-07-25

利用強大的軟件設(shè)計工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計工具 FPGA 萊迪思 | 2024-07-17

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

LatticeECP3設(shè)計的視頻協(xié)議板電路圖-FPGA配置

設(shè)計方案 LatticeECP3 設(shè)計視頻協(xié)議電路圖 -FPGA | 2011-06-27

Altera的FPGA下載常見問題經(jīng)驗小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗 | 2007-12-13

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計

設(shè)計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

英特爾 Panther Lake 移動處理器規(guī)格曝光：最高“4+8+4”16 核 CPU、12 Xe3 核顯

消費電子英特爾 CPU | 2024-07-16

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

英特爾披露可重配置無線電架構(gòu)計劃

hpnet | 2003-02-19

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

英特爾整車方案：拓寬汽車制造商利潤提升之路

汽車電子英特爾汽車制造商 | 2024-07-25

焦點

推薦視頻

技術(shù)專區(qū)