NeurIPS 2021 | 尋MixTraining: 一種全新的物體檢測訓練范式
來源:專知
MixTraining: 一種全新的物體檢測訓練范式
論文鏈接:
https://www.zhuanzhi.ai/paper/b52468c0ddce3d49f7740cfd1528a7a0
代碼鏈接(即將開源):
https://github.com/MendelXu/MixTraining
物體檢測是計算機視覺中的基礎(chǔ)課題。經(jīng)典的物體檢測器通常采用單一的數(shù)據(jù)增強策略,并簡單地使用人工標注的物體包圍盒來進行訓練,這種訓練策略也被稱為 SiTraining 范式。在本篇論文中,微軟亞洲研究院的研究員們提出了一種全新的物體檢測訓練范式:MixTraining。該范式通過引入 Mixed Training Targets(混合訓練目標)與 Mixed Data Augmentation(混合數(shù)據(jù)增廣),可以有效提升現(xiàn)有物體檢測器性能,并且不會在測試階段增加任何額外的開銷。如表4所示,MixTraining 能夠?qū)⒒?ResNet-50 的 Faster R-CNN 的檢測精度從41.7mAP 提升至44.3 mAP,并將基于 Swin-S 的 Cascade R-CNN 的檢測精度從 50.9mAP 提升至 52.8mAP。
表4:MixTraining 可以有效提升多種現(xiàn)有檢測器的檢測性能
除了良好的系統(tǒng)級性能提升以外,研究員們還對該范式為何有效進行了深入詳盡的分析與研究。研究員們首先對 Mixed Training Targets (混合訓練目標)的工作機理進行了分析。Mixed Training Targets (混合訓練目標)采用了老師-學生 (Teacher-Student)架構(gòu)來生成高質(zhì)量的檢測結(jié)果,并將這些檢測結(jié)果作為偽標注(Pseudo ground-truth)再與真實的人類標注 (Human-annotated ground-truth)結(jié)合起來共同作為網(wǎng)絡(luò)的訓練標注。研究員們發(fā)現(xiàn)這種使用混合標注有兩種好處:1)可以避免漏標的物體(missing label) ;2)可以降低標注中的定位噪聲(box loc noise) 。分析結(jié)果如表5所示。
表5:對混合訓練目標的消融實驗
其次,研究員們還對 Mixed Data Augmentation(混合數(shù)據(jù)增廣)進行了進一步的研究。研究員們猜測不同的訓練實例可能需要不同強度的數(shù)據(jù)增廣,而不能一概而論地對所有訓練示例使用統(tǒng)一的簡單或者過強的數(shù)據(jù)增廣,否則反而有可能會損害訓練性能,結(jié)果如表6所示。
表6:對混合數(shù)據(jù)增廣的消融實驗
與此同時,研究員們還發(fā)現(xiàn) MixTraining 可以在更長的訓練輪數(shù)中獲得更大的收益,結(jié)果如表7所示。
表7:MixTraining 可以在更長的訓練輪數(shù)中獲得更大的收益
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。