微軟發布的Dynamic Head,創造COCO新記錄:60.6AP

論文地址:https://arxiv.org/pdf/2106.08322.pdf
摘要
在目標檢測中結合定位和分類的復雜性導致了方法的蓬勃發展,以前的作業試圖提高各種物體檢測頭的性能,但未能呈現出統一的觀點,在本文中,我們提出了一種新穎的動態頭部框架,以將目標檢測頭部與注意力統一起來,通過在尺度感知的特征級別之間、空間感知的空間位置之間以及任務感知的輸出通道內相干地組合多個自注意力機制,所提出的方法顯著提高了物件檢測頭的表示能力,而無需任何計算開銷,進一步的實驗證明了所提出的動態頭在 COCO 基準上的有效性和效率,使用標準的 ResNeXt-101-DCN 主干,我們大大提高了流行物件檢測器的性能,并在 54.0 AP 上實作了新的最新技術,此外,借助最新的變壓器主干和額外資料,我們可以將當前最佳 COCO 結果推至 60.6 AP 的新記錄,代碼將在 https://github.com/microsoft/DynamicHead 上發布,
1 簡介
物體檢測是回答計算機視覺應用中“什么物體位于何處”的問題,在深度學習時代,幾乎所有現代物體檢測器 [11, 23, 12,35, 28, 31, 33] 共享相同的范式– 特征提取的主干和定位和分類任務的負責人,如何提高物體檢測頭的性能已經成為現有物體檢測作業中的關鍵問題,
開發一個好的物體檢測頭的挑戰可以概括為三類,首先,頭部應該是尺度感知的,因為具有截然不同尺度的多個物件通常共存于一個影像中,其次?
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/301381.html
標籤:其他
上一篇:C++中的復制建構式
