色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專欄

          EEPW首頁(yè) > 博客 > 干貨實(shí)踐 | Anchor優(yōu)化后在目標(biāo)檢測(cè)提升這么明顯

          干貨實(shí)踐 | Anchor優(yōu)化后在目標(biāo)檢測(cè)提升這么明顯

          發(fā)布人:CV研究院 時(shí)間:2021-01-21 來(lái)源:工程師 發(fā)布文章

          9.png

          目標(biāo)檢測(cè)發(fā)展已經(jīng)到了一個(gè)瓶頸,但是依然有很多優(yōu)秀的產(chǎn)出,比如最近比較火熱的“Anchor—Free”,貌似在該機(jī)制下精度有一定程度的提升,今天博主基于之前積累的知識(shí),為大家分享基于Anchor的優(yōu)化,主要涉及動(dòng)態(tài)特征選擇Anchor,增加深度特征的表示,最終精度大幅度提升。

          1.前言

          8.png

          基于無(wú)anchor機(jī)制的特征選擇模塊,是一個(gè)簡(jiǎn)單高效的單階段組件,其可以結(jié)合特征金字塔嵌入到單階段檢測(cè)器中。FSAF解決了傳統(tǒng)基于anchor機(jī)制的兩個(gè)限制:

          (1) 啟發(fā)式的特征選擇

          (2) overlap-based anchor采樣

          FSAF的通用解釋是將在線特征選擇應(yīng)用于與anchor無(wú)關(guān)的分支的訓(xùn)練上。即無(wú)anchor的分支添加到特征金字塔的每一層,從而可以以任意層次對(duì)box進(jìn)行編碼解碼。訓(xùn)練過(guò)程中,將每個(gè)實(shí)例動(dòng)態(tài)的放置在最適合的特征層次上。在進(jìn)行inference時(shí),F(xiàn)SAF可以結(jié)合帶anchor的分支并行的輸出預(yù)測(cè)結(jié)果。FSAF主要包含無(wú)anchor分支的實(shí)現(xiàn)及在線特征選擇兩部分。FSAF結(jié)合RetinaNet在COCO檢測(cè)任務(wù)上實(shí)現(xiàn)更高的準(zhǔn)確率及速度,獲得了44.6%的mAP,超過(guò)了當(dāng)前存在的單階段檢測(cè)網(wǎng)絡(luò)。

          但是,除了Anchor-Free,其實(shí)大部分檢測(cè)框架中使用的還是Anchor機(jī)制,在詳細(xì)分享今天的干貨之前,和大家預(yù)熱下 Anchor refinement module (ARM)。

          RefineDet中使用ARM模塊對(duì)anchor進(jìn)行微調(diào),然后將微調(diào)后的anchor送到ODM模塊中進(jìn)一步的預(yù)測(cè)。但是,對(duì)比ODM模塊和SSD就會(huì)發(fā)現(xiàn)。ODM中輸入的anchor尺寸不在是固定的,而是經(jīng)過(guò)調(diào)整之后的。也就是說(shuō),在SSD中anchor的W,H是一個(gè)標(biāo)量,但在ODM卻成了一個(gè)變量。更為重要的是,anchor成為一個(gè)變量后,ODM中的輸入并沒(méi)有發(fā)生變化,依舊是原始未經(jīng)過(guò)調(diào)整anchor對(duì)應(yīng)的feature-map,這種不對(duì)等性限制了網(wǎng)絡(luò)的性能。

          7.png

          所以Anchor的設(shè)計(jì)對(duì)One-Stage網(wǎng)絡(luò)的性能至關(guān)重要!

          就如上述所說(shuō),ARM被提出來(lái)調(diào)整默認(rèn)anchor的初始化,為檢測(cè)器提供了更好的anchor參考。然而,這個(gè)模塊帶來(lái)了另一個(gè)問(wèn)題:特征映射中的所有像素都具有相同的感受野,而與每個(gè)像素相關(guān)聯(lián)的anchor具有不同的位置和大小。這種不一致可能導(dǎo)致不太有效的檢測(cè)結(jié)果。

          于是,我想是不是應(yīng)該有一個(gè)動(dòng)態(tài)特征選擇操作,在一個(gè)特征映射中選擇新的像素,從中獲取最佳的anchor。根據(jù)新的anchor點(diǎn)位置和大小選擇像素,使這些像素的感受野能夠很好地適應(yīng)anchor區(qū)域,這使得檢測(cè)器,特別是回歸部分更容易優(yōu)化。此外,為了提高所選特征像素的表達(dá)能力,還設(shè)計(jì)了一個(gè)雙向特征融合模塊,將早期和深層特征相結(jié)合。

          6.jpg

          在One-Stage中,SSD和Yolo是大家常見(jiàn)的檢測(cè)框架,今天我就以SSD為例,和大家詳細(xì)說(shuō)下具體細(xì)節(jié)!

          ARM是One-Stage檢測(cè)器中使用的類似RPN模塊,是[Shifeng Zhang, Longyin Wen, Xiao Bian, Zhen Lei, and Stan Z Li. Single-shot refinement neural network for object detection. In Proceedings of the IEEE conference on computer vision and pattern recognition, 2018]首先提出的。它在多尺度檢測(cè)框架下,在每個(gè) detection source layer上附加兩個(gè)卷積核。ARM的主要目的是為每個(gè)anchor分配背景/前景分?jǐn)?shù)和預(yù)測(cè)調(diào)整的位置。利用二進(jìn)制分類分?jǐn)?shù)篩選出負(fù)樣本,并將細(xì)化的anchor發(fā)送到最終的目標(biāo)檢測(cè)模塊(ODM),與SSD中的檢測(cè)器頭完全相同。為了更好地分析ARM對(duì)探測(cè)器的影響,首先給出了探測(cè)器頭的邊界框回歸和分類的定義。

          5.jpg

          Bounding box regression

          4.jpg

          從上面的分析可以看出,ARM將導(dǎo)致輸入特征點(diǎn)的感受野與其相關(guān)的新細(xì)化anchor之間的不一致。這種不一致可能導(dǎo)致次優(yōu)檢測(cè)器,特別是對(duì)于回歸部分。

          一種簡(jiǎn)單的解決方案是基于anchor的新形狀動(dòng)態(tài)采樣檢測(cè)器頭的特征點(diǎn)。這樣,特征點(diǎn)就能夠感知anchor的存在。特征選擇函數(shù)可以寫(xiě)成如下:

          3.jpg

          整體的框架就差不多了,之后進(jìn)行簡(jiǎn)單的實(shí)驗(yàn)測(cè)試,驗(yàn)證其是否具有較好的性能!

          2.png

          上表是在VOC數(shù)據(jù)集中測(cè)試,使用的是SSD512網(wǎng)絡(luò)。

          1.png

          *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



          關(guān)鍵詞:

          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉