色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<address id="at0rz"><menu id="at0rz"></menu></address>

<dfn id="at0rz"><menu id="at0rz"></menu></dfn>

<menuitem id="at0rz"><fieldset id="at0rz"><dl id="at0rz"></dl></fieldset></menuitem>

"); //-->

博客專欄

EEPW首頁 > 博客 > 改進(jìn)Yolov5 | 用 GSConv+Slim Neck 一步步把 Yolov5 提升到極致！?。?/p>

改進(jìn)Yolov5 | 用 GSConv+Slim Neck 一步步把 Yolov5 提升到極致?。?！

發(fā)布人：計算機(jī)視覺工坊時間：2022-06-16 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

發(fā)布文章

作者丨ChaucerG來源丨集智書童

目標(biāo)檢測是計算機(jī)視覺中一項艱巨的下游任務(wù)。對于車載邊緣計算平臺，大模型很難達(dá)到實時檢測的要求。而且，由大量深度可分離卷積層構(gòu)建的輕量級模型無法達(dá)到足夠的準(zhǔn)確性。因此本文引入了一種新方法 GSConv 來減輕模型的復(fù)雜度并保持準(zhǔn)確性。GSConv 可以更好地平衡模型的準(zhǔn)確性和速度。并且，提供了一種設(shè)計范式，Slim-Neck，以實現(xiàn)檢測器更高的計算成本效益。在實驗中，與原始網(wǎng)絡(luò)相比，本文方法獲得了最先進(jìn)的結(jié)果（例如，SODA10M 在 Tesla T4 上以 ~100FPS 的速度獲得了 70.9% mAP0.5）。

1簡介

目標(biāo)檢測是無人駕駛汽車所需的基本感知能力。目前，基于深度學(xué)習(xí)的目標(biāo)檢測算法在該領(lǐng)域占據(jù)主導(dǎo)地位。這些算法在檢測階段有兩種類型：單階階段和兩階段。兩階段檢測器在檢測小物體方面表現(xiàn)更好，通過稀疏檢測的原理可以獲得更高的平均精度（mAP），但這些檢測器都是以速度為代價的。單階段檢測器在小物體的檢測和定位方面不如兩階段檢測器有效，但在工作上比后者更快，這對工業(yè)來說非常重要。

類腦研究的直觀理解是，神經(jīng)元越多的模型獲得的非線性表達(dá)能力越強(qiáng)。但不可忽視的是，生物大腦處理信息的強(qiáng)大能力和低能耗遠(yuǎn)遠(yuǎn)超出了計算機(jī)。無法通過簡單地?zé)o休止地增加模型參數(shù)的數(shù)量來構(gòu)建強(qiáng)大的模型。輕量級設(shè)計可以有效緩解現(xiàn)階段的高計算成本。這個目的主要是通過使用 Depth-wise Separable Convolution (DSC)操作來減少參數(shù)和FLOPs的數(shù)量來實現(xiàn)的，效果很明顯。

但是，DSC 的缺點也很明顯：輸入圖像的通道信息在計算過程中是分離的。

圖 1

對于自動駕駛汽車，速度與準(zhǔn)確性同樣重要。通過 GSConv 引入了 Slim-Neck 方法，以減輕模型的復(fù)雜度同時可以保持精度。GSConv 更好地平衡了模型的準(zhǔn)確性和速度。在圖 1 中，在 SODA10M 的無人駕駛數(shù)據(jù)集上比較了最先進(jìn)的 Slim-Neck 檢測器和原始檢測器的速度和準(zhǔn)確度。結(jié)果證實了該方法的有效性。

圖2

圖2（a）和（b）顯示了 DSC 和標(biāo)準(zhǔn)卷積（SC）的計算過程。這種缺陷導(dǎo)致 DSC 的特征提取和融合能力比 SC 低得多。優(yōu)秀的輕量級作品，如 Xception、MobileNets 和 ShuffleNets，通過 DSC 操作大大提高了檢測器的速度。但是當(dāng)這些模型應(yīng)用于自動駕駛汽車時，這些模型的較低準(zhǔn)確性令人擔(dān)憂。事實上，這些工作提出了一些方法來緩解 DSC 的這個固有缺陷（這也是一個特性）：MobileNets 使用大量的 1×1 密集卷積來融合獨立計算的通道信息；ShuffleNets 使用channel shuffle來實現(xiàn)通道信息的交互，而 GhostNet 使用 halved SC 操作來保留通道之間的交互信息。但是，1×1的密集卷積反而占用了更多的計算資源，使用channel shuffle效果仍然沒有觸及 SC 的結(jié)果，而 GhostNet 或多或少又回到了 SC 的路上，影響可能會來從很多方面。

許多輕量級模型使用類似的思維來設(shè)計基本架構(gòu)：從深度神經(jīng)網(wǎng)絡(luò)的開始到結(jié)束只使用 DSC。但 DSC 的缺陷直接在主干中放大，無論是用于圖像分類還是檢測。作者相信 SC 和 DSC 可以結(jié)合在一起使用。僅通過channel shuffle DSC 的輸出通道生成的特征圖仍然是“深度分離的”。

圖 3

為了使 DSC 的輸出盡可能接近 SC，引入了一種新方法——GSConv。如圖 3 所示，使用 shuffle 將 SC 生成的信息（密集卷積操作）滲透到 DSC 生成的信息的每個部分。這種方法允許來自 SC 的信息完全混合到 DSC 的輸出中，沒有花里胡哨的東西。

圖 4

圖 4 顯示了 SC、DSC 和 GSConv 的可視化結(jié)果。GSConv 的特征圖與 SC 的相似性明顯高于 DSC 與 SC 的相似。當(dāng)在 Backbone 使用 SC，在Neck使用 GSConv（slim-neck）時，模型的準(zhǔn)確率非常接近原始；如果添加一些技巧，模型的準(zhǔn)確性和速度就會超過原始模型。采用 GSConv 方法的Slim-Neck可最大限度地減少 DSC 缺陷對模型的負(fù)面影響，并有效利用 DSC 的優(yōu)勢。

主要貢獻(xiàn)可以總結(jié)如下：

引入了一種新方法 GSConv 來代替 SC 操作。該方法使卷積計算的輸出盡可能接近 SC，同時降低計算成本；
為自動駕駛汽車的檢測器架構(gòu)提供了一種新的設(shè)計范式，即帶有標(biāo)準(zhǔn) Backbone 的 Slim-Neck 設(shè)計；
驗證了不同 Trick 的有效性，可以作為該領(lǐng)域研究的參考。

2本文方法2.1 為什么要在Neck中使用GSConv

為了加速預(yù)測的計算，CNN 中的饋送圖像幾乎必須在 Backbone 中經(jīng)歷類似的轉(zhuǎn)換過程：空間信息逐步向通道傳輸。并且每次特征圖的空間（寬度和高度）壓縮和通道擴(kuò)展都會導(dǎo)致語義信息的部分丟失。密集卷積計算最大限度地保留了每個通道之間的隱藏連接，而稀疏卷積則完全切斷了這些連接。

GSConv 盡可能地保留這些連接。但是如果在模型的所有階段都使用它，模型的網(wǎng)絡(luò)層會更深，深層會加劇對數(shù)據(jù)流的阻力，顯著增加推理時間。當(dāng)這些特征圖走到 Neck 時，它們已經(jīng)變得細(xì)長（通道維度達(dá)到最大，寬高維度達(dá)到最?。?，不再需要進(jìn)行變換。因此，更好的選擇是僅在 Neck 使用 GSConv（Slim-Neck + 標(biāo)準(zhǔn)Backbone）。在這個階段，使用 GSConv 處理 concatenated feature maps 剛剛好：冗余重復(fù)信息少，不需要壓縮，注意力模塊效果更好，例如 SPP 和 CA。

2.2 Slim-Neck

作者研究了增強(qiáng) CNN 學(xué)習(xí)能力的通用方法，例如 DensNet、VoVNet 和 CSPNet，然后根據(jù)這些方法的理論設(shè)計了 Slim-Neck 結(jié)構(gòu)。

1、Slim-Neck中的模塊

首先，使用輕量級卷積方法 GSConv 來代替 SC。其計算成本約為 SC 的60%~70%，但其對模型學(xué)習(xí)能力的貢獻(xiàn)與后者不相上下。然后，在 GSConv 的基礎(chǔ)上繼續(xù)引入 GSbottleneck，圖5（a）展示了 GSbottleneck 模塊的結(jié)構(gòu)。

圖5

同樣，使用一次性聚合方法來設(shè)計跨級部分網(wǎng)絡(luò) (GSCSP) 模塊 VoV-GSCSP。VoV-GSCSP 模塊降低了計算和網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性，但保持了足夠的精度。圖 5 (b) 顯示了 VoV-GSCSP 的結(jié)構(gòu)。值得注意的是，如果我們使用 VoV-GSCSP 代替 Neck 的 CSP，其中 CSP 層由標(biāo)準(zhǔn)卷積組成，FLOPs 將平均比后者減少 15.72%。

最后，需要靈活地使用3個模塊，GSConv、GSbottleneck 和 VoV-GSCSP。

2、Slim-Neck針對YOLO系列的設(shè)計

YOLO 系列檢測器由于檢測效率高，在行業(yè)中應(yīng)用更為廣泛。這里使用 slim-neck 的模塊來改造 Scaled-YOLOv4 和 YOLOv5 的 Neck 層。圖 6 和圖 7 顯示了2種 slim-neck 架構(gòu)。

圖 6圖 7

3、免費的改進(jìn)Tricks

可以在基于 CNNs 的檢測器中使用一些局部特征增強(qiáng)方法，結(jié)構(gòu)簡單，計算成本低。這些增強(qiáng)方法，注意力機(jī)制，可以顯著提高模型精度，而且比Neck 簡單得多。這些方法包括作用于通道信息或空間信息。SPP 專注于空間信息，它由4個并行分支連接：3個最大池操作（kernel-size為 5×5、9×9 和 13×13）和輸入的 shortcut 方式。它用于通過合并輸入的局部和全局特征來解決對象尺度變化過大的問題。YOLOv5 作者的 SPP 改進(jìn)模塊 SPPF 提高了計算效率。該效率增加了近 277.8%。通式為：

其中，是 SPPF 模塊中第i個分支的最大池化的kernel-size。圖 8圖 8 (a) 和 (b) 顯示了 SPP 和 SPPF 的結(jié)構(gòu)。SE是一個通道注意力模塊，包括兩個操作過程：squeeze和excitation。該模塊允許網(wǎng)絡(luò)更多地關(guān)注信息量更大的特征通道，而否定信息量較少的特征通道。CBAM 是一個空間通道注意力機(jī)制模塊。CA 模塊是一種新的解決方案，可以避免全局池化操作導(dǎo)致的位置信息丟失：將注意力分別放在寬度和高度兩個維度上，以有效利用輸入特征圖的空間坐標(biāo)信息。圖9(a)、(b)和(c) 顯示了 SE、CBAM 和 CA 模塊的結(jié)構(gòu)。圖 9

4、損失和激活函數(shù)

IoU 損失對于基于深度學(xué)習(xí)的檢測器具有很大的價值。它使預(yù)測邊界框回歸的位置更加準(zhǔn)確。隨著研究的不斷發(fā)展，許多研究人員已經(jīng)提出了更高級的 IoU 損失函數(shù)，例如 GIoU、DIoU、CIoU 和最新的 EIoU。5個損失函數(shù)定義如下：其中參數(shù)“A”和“B”表示Ground truth邊界框的面積和預(yù)測邊界框的面積；參數(shù)“C”表示Ground truth邊界框和預(yù)測邊界框的最小包圍框的面積；參數(shù)“d”表示封閉框的對角線頂點的歐式距離；參數(shù)“ρ”表示Ground truth邊界框和預(yù)測邊界框質(zhì)心的歐式距離；參數(shù)“α”是權(quán)衡的指標(biāo)，參數(shù)“v”是評價Ground truth邊界框和預(yù)測邊界框長寬比一致性的指標(biāo)。CIoU loss是目前Anchor-based檢測器中使用最廣泛的損失函數(shù)，但CIoU loss仍然存在缺陷：其中“δv /δw”是“v”相對于“w”的梯度，“δv/δh”是“v”相對于“h”的梯度。圖 10根據(jù) CIoU 損失的定義，如果，CIoU 損失將退化為DIoU損失，即CIoU損失中添加的懲罰項的相對比例（αv）將不起作用。此外，w和h的梯度符號相反。因此，這兩個變量（w或h）只能在同一方向上更新，同時增加或減少。這不符合實際應(yīng)用場景，尤其是當(dāng) 且 $hw^{gt}且h>h^{gt}$ 時。EIoU loss沒有遇到這樣的問題，它直接使用預(yù)測邊界框的w和h獨立作為懲罰項，而不是w和h的比值。圖10是這些損失函數(shù)的不同評估指標(biāo)的3個示例。在深度網(wǎng)絡(luò)上，使用 Swish 和 Mish 的模型的準(zhǔn)確性和訓(xùn)練穩(wěn)定性通常比 ReLU 差。Swish 和 Mish 都具有無上界和下界、平滑和非單調(diào)的特性。它們定義如下：在更深的網(wǎng)絡(luò)上，Mish 的模型準(zhǔn)確度略好于 Swish，盡管實際上2條激活函數(shù)曲線非常接近。與 Swish 相比，Mish 由于計算成本的增加而消耗更多的訓(xùn)練時間。

3實驗3.1 Trick消融實驗

3.2 損失函數(shù)對比

3.3 Yolo改進(jìn)

3.4 可視化結(jié)果對比

4參考

[1].Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

WTC-AI太陽能熱水器電路圖

設(shè)計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計算 Meta AI | 2024-07-31

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達(dá) GPU | 2024-07-26

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

AI+機(jī)器視覺成趨勢，圖文詳解N大應(yīng)用場景

智能計算安森美 AI 機(jī)器視覺 | 2024-07-31

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

WTC-AI型太陽能熱水器電路圖

設(shè)計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

iPhone 16將不會預(yù)裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

AI驅(qū)動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

Nvidia的CEO談AI的未來：“我們將需要三臺電腦... 一臺來創(chuàng)建AI... 一臺來模擬AI... 一臺來運行AI”

智能計算 AI | 2024-07-31

CSR8670CSR8675智能語音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計算 AI | 2024-07-30

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

焦點

推薦視頻

更多>>

技術(shù)專區(qū)

<ol id="v1kwr"><strong id="v1kwr"></strong></ol>

<strong id="v1kwr"><acronym id="v1kwr"><ins id="v1kwr"></ins></acronym></strong>