色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          "); //-->

          博客專(zhuān)欄

          EEPW首頁(yè) > 博客 > 貝葉斯優(yōu)化與結(jié)構(gòu)化預(yù)測(cè) | 大幅度提升目標(biāo)檢測(cè)精度

          貝葉斯優(yōu)化與結(jié)構(gòu)化預(yù)測(cè) | 大幅度提升目標(biāo)檢測(cè)精度

          發(fā)布人:CV研究院 時(shí)間:2022-04-14 來(lái)源:工程師 發(fā)布文章
          節(jié)假日在家里整理資料,發(fā)現(xiàn)一篇很早之前閱讀過(guò)的一篇paper,主要用貝葉斯優(yōu)化器和結(jié)構(gòu)化預(yù)測(cè)來(lái)提升目標(biāo)檢測(cè)的精度,今天和大家分享下這框架,有興趣的同學(xué)可以在這條想法上繼續(xù)衍生,提出更好的新想法新框架!

          一、前言&簡(jiǎn)要

          基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)系統(tǒng)最近在幾個(gè)目標(biāo)檢測(cè)基準(zhǔn)上取得了突破性的進(jìn)展。雖然這些high-capacity神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的特征可以區(qū)分類(lèi)別,但不準(zhǔn)確的定位仍然是檢測(cè)錯(cuò)誤的主要來(lái)源。在高容量CNN架構(gòu)的基礎(chǔ)上,研究者通過(guò)以下來(lái)解決定位問(wèn)題。1)使用基于貝葉斯優(yōu)化的搜索算法,按順序提出目標(biāo)邊界框的候選區(qū)域;2)用結(jié)構(gòu)化損失訓(xùn)練CNN,明確地懲罰CNN的定位不準(zhǔn)確性。

          圖片

          在實(shí)驗(yàn)中,研究者證明了在VOC 2007年和2012年的數(shù)據(jù)集上,所提出的每種方法都比基線(xiàn)方法提高了檢測(cè)性能。此外,兩種方法是互補(bǔ)的,結(jié)合起來(lái)明顯優(yōu)于以前的先進(jìn)技術(shù)。

          、背景

          DPM及其變體多年來(lái)一直是目標(biāo)檢測(cè)任務(wù)的主要方法。這些方法使用圖像描述符,如HOG、SIFT和LBP作為特征,并密集地掃描整個(gè)圖像,以找到最大的響應(yīng)區(qū)域。隨著CNN在大規(guī)模目標(biāo)識(shí)別上取得的顯著成功,提出了幾種基于CNNs的檢測(cè)方法。遵循傳統(tǒng)的區(qū)域候選滑動(dòng)窗口方法,Sermanet等人[Sermanet, D. Eigen, X. Zhang, M. Mathieu, R. Fergus, and Y. LeCun. OverFeat: Integrated recognition, localization and detection using convolutional networks. In ICLR, 2014 ]提出使用cnn對(duì)整個(gè)圖像進(jìn)行詳盡的搜索,但通過(guò)在多個(gè)尺度上同時(shí)對(duì)整個(gè)圖像進(jìn)行卷積,使其有效。除了滑動(dòng)窗法,Szegedy等人[C. Szegedy, A. Toshev, and D. Erhan. Deep neural networks for object detection. In NIPS]使用CNNs返回圖像中目標(biāo)的邊界框,并使用另一個(gè)CNN分類(lèi)器來(lái)驗(yàn)證預(yù)測(cè)的框是否包含對(duì)象。Girshick等人[R. Girshick, J. Donahue, T. Darrell, and J. Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In CVPR]根據(jù)“recognition using regions”范式提出了R-CNN,這也激發(fā)了之前幾種最先進(jìn)的方法。在該框架下,通過(guò)選擇性搜索算法為圖像提出了幾百或數(shù)千個(gè)區(qū)域,CNN確定這些候選區(qū)域。研究者的新方法是建立在使用[K. Simonyan and A. Zisserman. Very deep convolutional networks for large-scale image recognition. In ICLR]中提出的CNN的R-CNN框架上的,但是,1)一種新的方法在定位差的情況下提出額外的邊界框,2)一個(gè)具有提高定位靈敏度的分類(lèi)器。

          三、Fine-grained search for bounding box via Bayesian optimization

          圖片

          3.1 General Bayesian optimization framework

          在貝葉斯優(yōu)化框架中,假設(shè)f=(x,y)是從概率模型中提取的:

          圖片

          貝葉斯優(yōu)化在函數(shù)計(jì)算的數(shù)量方面是有效的,當(dāng)f的計(jì)算成本昂貴時(shí)也特別有效。當(dāng)a(yN | DN)比f(wàn)計(jì)算要簡(jiǎn)便得多,而arg max yN+1(yN+1 | DN)的計(jì)算只需要一些函數(shù)計(jì)算時(shí),可以有效地找到一個(gè)更接近GT的解決方案。

          3.2 Efficient region proposal via GP regression

          在這里,研究者使用常數(shù)平均函數(shù)m(y) = m0和SEard,確定如下:

          圖片

          GP回歸(GPR)問(wèn)題試圖找到一個(gè)新的參數(shù)yN1,給定N個(gè)觀(guān)測(cè)DN,最大化獲取函數(shù)的值,在者情況下,用期望的改進(jìn)(EI)定義為:

          圖片

          3.3Local fine-grained search

          圖片


          四、實(shí)驗(yàn)

          圖片

          圖片

          圖片

          圖片


          *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



          關(guān)鍵詞: AI

          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉