色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

新聞中心

EEPW首頁 > 智能計算 > 新品快遞 > 瑞薩黑科技——高性能AI加速模塊DRP－AI

瑞薩黑科技——高性能AI加速模塊DRP－AI

作者：時間：2024-06-26 來源：瑞薩

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

現(xiàn)代社會的各個方面都需要先進(jìn)的人工智能（AI）來處理，例如對周圍環(huán)境的識別、行動決策和運(yùn)動控制，這包括工廠、物流、醫(yī)療、城市中的服務(wù)機(jī)器人以及安全攝像頭等應(yīng)用場景。然而，要在邊緣端實現(xiàn)人工智能，我們需要克服兩大挑戰(zhàn)：功耗和靈活性。

在云端，我們可以配備足夠的電源和冷卻機(jī)制來支持復(fù)雜的AI模型，但邊緣端的設(shè)備往往限制了功耗，這可能導(dǎo)致運(yùn)行時間的縮短和成本的增加。此外，隨著AI模型不斷發(fā)展，專用的AI加速硬件很快就會過時，這意味著我們需要一種更靈活的解決方案來支持新開發(fā)的AI模型。因此，嵌入式端的AI加速成為一個重要的解決方案，它可以在邊緣設(shè)備上實現(xiàn)AI任務(wù)的高效執(zhí)行，并為新的AI模型提供靈活性和支持。

為了滿足市場需求，瑞薩自主研發(fā)了用于AI加速的處理器DRP-AI（Dynamically Reconfigurable Processor for AI人工智能動態(tài)可配置處理器），該處理器集成與RZ/V系列芯片中。

DRP-AI處理器具備邊緣端設(shè)備所需的低功耗和靈活性，經(jīng)過多年技術(shù)迭代已發(fā)展到第三代，實現(xiàn)了比上一代高約10倍的能效。DRP-AI3（集成與RZ/V2H）能夠適應(yīng)AI的進(jìn)一步發(fā)展和高性能機(jī)器人等應(yīng)用的復(fù)雜要求。

DRP-AI3解決了低功耗挑戰(zhàn)，并實現(xiàn)了高實時處理。它為具有AI能力的產(chǎn)品提供了更高性能和更低功耗。接下來，我們將深入了解DRP-AI3是如何實現(xiàn)這些目標(biāo)的。

軟、硬結(jié)合系統(tǒng)性地實現(xiàn)AI模型的高速和低功耗

量化

從傳統(tǒng)的16位浮點運(yùn)算更改為8位整數(shù)運(yùn)算（INT8）。該方法也是現(xiàn)在比較流行的一種運(yùn)算處理方式。

本文引用地址：http://cafeforensic.com/article/202406/460345.htm

瑞薩黑科技——高性能AI加速模塊DRP－AI

修剪

采用靈活的N:M修剪方法

瑞薩黑科技——高性能AI加速模塊DRP－AI

N:M技術(shù)的基本概念是將原始權(quán)重矩陣劃分為M行的權(quán)重矩陣組，并將其重構(gòu)為較小的N行權(quán)重矩陣組。在每組中，只提取有效權(quán)重，然后對新的權(quán)重矩陣組進(jìn)行并行運(yùn)算。DRP-AI3引入了一個新功能，它可以通過自由切換每個權(quán)重矩陣組的N值來調(diào)整運(yùn)算周期的數(shù)量，從而可以在實際的AI模型中對局部變化的修剪率執(zhí)行最優(yōu)的運(yùn)算處理。這種精細(xì)改變N的能力還允許詳細(xì)設(shè)置整個權(quán)重矩陣的修剪率，根據(jù)用戶對功耗、操作速度和識別精度的要求進(jìn)行最佳的修剪處理。

瑞薩黑科技——高性能AI加速模塊DRP－AI

AI系統(tǒng)架構(gòu)實現(xiàn)高功效

通過數(shù)據(jù)重用技術(shù)減少外部存儲器通信

DRP-AI采用了一種有效地重用一次輸入到AI-MAC的技術(shù)。例如，在3x3濾波器的卷積運(yùn)算中，一個數(shù)據(jù)像素用于九個濾波器運(yùn)算。im2col被廣泛用作GPU中的高度并行運(yùn)算方法，它以矩陣運(yùn)算的順序擴(kuò)展所有圖像數(shù)據(jù)作為輸入到GPU的預(yù)處理步驟。然而，這會導(dǎo)致一個像素的數(shù)據(jù)信息出現(xiàn)九次，數(shù)據(jù)的數(shù)量增加了九倍，進(jìn)而增加了功耗和通信帶寬的消耗。相比之下，AI-MAC可以通過將取入與MAC算術(shù)單元相對應(yīng)的寄存器中的數(shù)據(jù)移位到相鄰寄存器來重用數(shù)據(jù)，從而避免了重復(fù)存儲和傳輸數(shù)據(jù)，減少了功耗和通信帶寬的消耗。

通過采用如下圖所示的配置，與GPU相比，從外部存儲器和內(nèi)部緩沖器到AI-MAC的數(shù)據(jù)加載的數(shù)量可以減少多達(dá)九倍。這種優(yōu)化方案顯著降低了數(shù)據(jù)移動所需的功率和通信帶寬消耗。此外，AI-MAC不僅可以對輸入數(shù)據(jù)進(jìn)行重用，還可以對輸出和權(quán)重信息進(jìn)行重用，從而將對外部存儲器的訪問減少了一個數(shù)量級以上。

瑞薩黑科技——高性能AI加速模塊DRP－AI

使用輸入的零數(shù)據(jù)控制功耗

人工智能模型計算的一個特點是每一層的權(quán)重數(shù)據(jù)和輸入/輸出數(shù)據(jù)中“零”值的比例很高，這被稱為稀疏化。例如，在圖像識別模型中，所有層50%以上的輸入和輸出數(shù)據(jù)平均為零值。這主要是因為許多人工智能模型使用激活函數(shù)（如ReLU），該函數(shù)會將乘積和運(yùn)算的所有負(fù)結(jié)果替換為零。在DRP-AI中，通過引入切換技術(shù)來減少不必要的計算能力。該切換技術(shù)預(yù)先檢測何時在操作的每個元素輸入中輸入零，并防止不必要的操作。

操作調(diào)度流程

除了數(shù)據(jù)重用技術(shù)之外，優(yōu)化外部數(shù)據(jù)訪問或MAC處理等操作的順序和定時對于有效的AI執(zhí)行至關(guān)重要。換句話說，調(diào)度操作流程可以最大化DRP-AI的性能。

例如，通過調(diào)度外部存儲器訪問定時，可以在AI-MAC操作期間提前讀取下一操作的權(quán)重信息并將其存儲在緩沖器中，從而防止和減少外部存儲器訪問延遲。這種方式也可應(yīng)用于內(nèi)部存儲器訪問和任何內(nèi)部算術(shù)處理的定時中，調(diào)度可以避免每個處理之間不必要的等待時間和功耗的產(chǎn)生。由于DRP-AI工具自動生成這種優(yōu)化的調(diào)度，用戶能夠輕松應(yīng)對。

瑞薩黑科技——高性能AI加速模塊DRP－AI

瑞薩開發(fā)的DRP-AI3（人工智能動態(tài)可重構(gòu)處理器）是一種獨特的AI加速器。它將嵌入式端所需的低功耗和靈活性與人工智能模型輕量級的處理能力相結(jié)合，相較于以前的模型，DRP-AI3的能效提高了10倍（10 TOPS/W）。

瑞薩將繼續(xù)擴(kuò)大研發(fā)RZ/V系列，以提供更多配備這種卓越AI加速器的MPU產(chǎn)品。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：瑞薩 DRP

評論

相關(guān)推薦

NC30編譯器中文手冊

資源下載瑞薩 C編譯器 V.5.43 M16C NC30 編程技術(shù) | 2008-07-17

TI單芯片手機(jī)多媒體電話解決方案OMAPV1035

資源下載 TI eCosto OMAPV1035 單片機(jī) 手機(jī)多媒體 DRP CMOS RF GSM GPRS | 2008-01-11

[求助]請問哪位用過瑞薩R8C/Tiny/11系列芯片？幫幫忙救急

clackfly | 2005-02-25

釋放前所未有的能效：瑞薩先進(jìn)的110納米制程技術(shù)

嵌入式系統(tǒng) 110納米瑞薩微控制器 | 2024-05-28

瑞薩運(yùn)動檢測器技術(shù)解決方案

設(shè)計方案瑞薩運(yùn)動檢測器 Motion sensors | 2014-12-16

瑞薩：領(lǐng)跑未來數(shù)據(jù)處理與實時應(yīng)用新紀(jì)元

嵌入式系統(tǒng) 202405 瑞薩數(shù)據(jù)處理 | 2024-05-12

基于瑞薩R8C系列單片機(jī)的機(jī)頂盒方案

設(shè)計方案瑞薩 R8C 單片機(jī) 機(jī)頂盒 | 2014-12-15

華寶DRP-36RA自動電熱水瓶電路圖

設(shè)計方案華寶 DRP-36RA 自動熱水瓶電路圖 | 2011-07-27

[求助]請問哪位大蝦用過瑞薩R8C/Tiny/11系列芯片？

clackfly | 2005-02-24

Renesas EPS解決方案

設(shè)計方案瑞薩 EPS解決方案 | 2014-12-15

TI移動無線LAN解決方案

資源下載 TI Wireless LAN DRP WiLink 4.0 mWLAN IEEE 802.11 | 2008-01-10

瑞薩和Macronix攜手開發(fā)0.13微米高密度閃存芯片

luden | 2005-10-09

端點高性能視覺AI處理的注意事項

智能計算瑞薩視覺AI | 2024-07-23

瑞薩R8C/2L單片機(jī)的特殊寄存器定義

資源下載瑞薩 R8C 單片機(jī) 特殊寄存器 | 2008-04-07

瑞薩圖像處理硬件加速器中間件

fanghlin | 2005-09-26

瑞薩黑科技——高性能AI加速模塊DRP－AI

智能計算瑞薩 DRP | 2024-06-26

瑞薩推出兼顧超低功耗和卓越25fs-rms抖動性能的全新FemtoClock? 3時鐘解決方案

模擬技術(shù) 瑞薩 FemtoClock 時鐘 | 2024-04-19

如何用IO-Link 通信鑄造先進(jìn)工業(yè)解決方案

工控自動化 IO-Link 工業(yè)通信瑞薩 | 2024-05-23

瑞薩智能垃圾箱，為城市環(huán)衛(wèi)管理賦能

消費電子智能垃圾箱瑞薩智慧城市 | 2024-05-28

TOUR 游會雜記--現(xiàn)場視頻

視頻瑞薩 TOUR 游會 | 2016-11-11

紅帽與瑞薩電子合作，推動軟件定義汽車的開源發(fā)展

汽車電子紅帽瑞薩軟件定義汽車開源 | 2024-05-23

[公告]瑞薩單片機(jī)國內(nèi)一級代理商簡介

kagasz | 2005-04-05

瑞薩完成對Transphorm的收購

電源與新能源瑞薩 Transphorm | 2024-06-21

瑞薩R8C系列單片機(jī)的中央控制板技術(shù)解決方案

設(shè)計方案瑞薩 R8C 單片機(jī) 中央控制板 | 2014-12-16

高性能嵌入式工作區(qū) (HEW) V.4.04 用戶手冊

資源下載瑞薩高性能嵌入式工作區(qū) HEW 高級創(chuàng)建編輯器工具管理自定義環(huán)境版本控制 Visual SourceSafe 共享工程比較文件導(dǎo)航映像命令行宏錄制調(diào)試器 | 2008-09-09

如何為您的電機(jī)控制系統(tǒng)增加更多價值?

工控自動化電機(jī)控制瑞薩 RA8T1 | 2024-05-28

焦點

推薦視頻

技術(shù)專區(qū)