色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 百度發(fā)布XPU:AI云計算加速芯片(基于FPGA,256核心)

          百度發(fā)布XPU:AI云計算加速芯片(基于FPGA,256核心)

          作者: 時間:2017-08-25 來源:量子位 收藏

            剛剛在加州Hot Chips大會上,發(fā)布,這是一款256核、基于FPGA的云計算加速芯片。合作伙伴是賽思靈(Xilinx)。也在這次的大會上,透露了關(guān)于這款芯片的更多架構(gòu)方面的細節(jié)。

          本文引用地址:http://cafeforensic.com/article/201708/363484.htm

            過去幾年,在深度學習領(lǐng)域,尤其是基于GPU的深度學習領(lǐng)域取得了不錯的進展。而且,百度也在開發(fā)被稱作的新處理器。

            百度研究員歐陽劍表示,百度設(shè)計的芯片架構(gòu)突出多樣性,著重于計算密集型、基于規(guī)則的任務,同時確保效率、性能和靈活性的最大化。今天,他在Hot Chips大會上與來自FPGA廠商Xilinx的人士一同發(fā)布了

              

            △ 百度去年宣布采用Xilinx Kintex UltraScale FPGA加速數(shù)據(jù)中心的額機器學習應用

            XPU的目標是在性能和效率之間實現(xiàn)平衡,并處理多樣化的計算任務。FPGA加速器本身很擅長處理某些計算任務,但隨著許多小內(nèi)核交織在一起,多樣性程度將會上升。

            歐陽劍表示:“FPGA是高效的,可以專注于特定計算任務,但缺乏可編程能力。傳統(tǒng)CPU擅長通用計算任務,尤其是基于規(guī)則的計算任務,同時非常靈活。GPU瞄準了并行計算,因此有很強大的性能。XPU則關(guān)注計算密集型、基于規(guī)則的多樣化計算任務,希望提高效率和性能,并帶來類似CPU的靈活性?!?/p>

            目前XPU有所欠缺的仍是可編程能力,而這也是涉及FPGA時普遍存在的問題。到目前為止,XPU尚未提供編譯器。不過歐陽劍表示,該團隊將會很快開發(fā)一款編譯器。

            歐陽劍還表示為了支持矩陣、卷積,以及其他大大小小的內(nèi)核,我們需要一個配備高帶寬低延時內(nèi)存,以及高帶寬I/O接口的大型數(shù)學陣列。FPGA中XPU的DSP單元提供了并行處理能力,片外DDR4和HBM接口優(yōu)化了數(shù)據(jù)傳輸,而片上SRAM則提供了必要的存儲特性。

            在Micro Benchmark測試中,對于計算密集型、常規(guī)內(nèi)存訪問的計算任務,XPU的效率與x86內(nèi)核類似。對于數(shù)據(jù)同步的計算任務,XPU的可擴展性應當可以進一步優(yōu)化。而對于沒有數(shù)據(jù)同步的計算任務,XPU的可擴展性與核心數(shù)量呈線性關(guān)系。

            這就是問題所在。如前所述,XPU仍然沒有配備編譯器。這款處理器在FPGA上實現(xiàn),通過訂制的邏輯電路提供指令。這些小核心類似于CPU,開發(fā)者只能使用匯編語言,而所有的執(zhí)行都由主機來控制。整個流程包括拆分計算任務,編寫XPU代碼,調(diào)用專用的邏輯函數(shù),從而在Linux平臺上進行編譯和運行。

              

           

              

            △ XPU具有256個內(nèi)核,集成了一個共享內(nèi)存用于數(shù)據(jù)同步。所有內(nèi)核都運行在600MHz。

            歐陽劍稱:“在百度,我們使用FPGA已有多年時間。我們的數(shù)據(jù)中心、云計算平臺和自動駕駛項目中有大量FPGA。我們非常了解FPGA的優(yōu)缺點,以及如何優(yōu)化。憑借XPU的大型核心,我們專注于多樣化的計算任務?!?/p>

            去年有媒體報道了基于百度深度學習SDA的SQL加速器。當時的數(shù)據(jù)流基于SA架構(gòu)。根據(jù)歐陽劍的描述,這也是XPU內(nèi)存帶寬和延時優(yōu)勢的核心。

            歐陽劍同時展示了今年完成的一些benchmark測試,但信息非常粗略。不過,這只是百度第一次公開展示XPU。

            如果XPU被證明可以用于AI、數(shù)據(jù)分析、云計算和無人駕駛,那么百度可能需要用ASIC技術(shù)去開發(fā)XPU。

           



          關(guān)鍵詞: 百度 XPU

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉