無(wú)需標(biāo)注海量數(shù)據(jù),目標(biāo)檢測(cè)新范式OVD讓多模態(tài)AGI又前進(jìn)一步
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)中一個(gè)非常重要的基礎(chǔ)任務(wù),與常見(jiàn)的的圖像分類(lèi) / 識(shí)別任務(wù)不同,目標(biāo)檢測(cè)需要模型在給出目標(biāo)的類(lèi)別之上,進(jìn)一步給出目標(biāo)的位置和大小信息,在 CV 三大任務(wù)(識(shí)別、檢測(cè)、分割)中處于承上啟下的關(guān)鍵地位。
轉(zhuǎn)自《360AI研究院》
OVD基本流程示意
論文1:Open-Vocabulary Object Detection Using Captions
- 論文地址:https://arxiv.org/pdf/2011.10678.pdf
- 代碼地址:https://github.com/alirezazareian/ovr-cnn
- 論文地址:https://arxiv.org/abs/2112.09106
- 代碼地址:https://github.com/microsoft/RegionCLIP
論文3:CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
- 論文地址:https://arxiv.org/abs/2303.13076
- 代碼地址:https://github.com/tgxs002/CORA
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。