本文提出一種新的基于DCT頻率域的通道注意力,其在分類、檢測和分割任務上,性能優于SENet、CBAM和GCNet等主干,代碼和模型即將開源!
注:文末附計算機視覺交流群
FcaNet: Frequency Channel Attention Networks

- 作者單位:浙江大學(李璽團隊)
- 論文:https://arxiv.org/abs/2012.11879
注意力機制,尤其是通道注意力,在計算機視覺領域取得了巨大的成功,許多作業專注于如何設計有效的通道注意力機制,同時忽略一個基本問題,即使用全域平均池(GAP)作為毫無疑問的預處理方法,
在這項作業中,我們從不同的角度出發,并使用frequency analysis重新考慮通道的注意力,基于頻率域分析,我們在數學上證明了傳統的GAP是頻域中特征分解的特例,有了證明,我們自然地在頻域上概括了通道注意力機制的預處理,并提出了具有新穎的multi-spectral通道注意力的FcaNet,




所提出的方法簡單但有效,我們只在計算中更改一行代碼,以在現有通道注意力方法中實施我們的方法,

主要貢獻:

實驗結果
與其他在影像分類,目標檢測和實體分割任務上的通道注意力方法相比,該方法可實作最新的結果,與基線SENet-50相比,在相同數量的引數和相同的計算成本的情況下,我們的方法在ImageNet上的Top-1準確性方面可提高1.8%,我們的代碼和模型將公開提供,

CVer-計算機視覺交流群
建了CVer微信交流群!細分方向已涵蓋:目標檢測、影像分割、目標跟蹤、人臉檢測&識別、OCR、姿態估計、超解析度、SLAM、醫療影像、Re-ID、GAN、NAS、深度估計、自動駕駛、強化學習、車道線檢測、模型剪枝&壓縮、去噪、去霧、去雨、風格遷移、遙感影像、行為識別、視頻理解、影像融合、影像檢索、論文投稿&交流、PyTorch和TensorFlow等群,
想要進計算機視覺學習交流群的同學,可以直接加微信號:CVer5555,加的時候備注一下:研究方向+學校+昵稱,即可,然后就可以拉你進群了,
強烈推薦大家關注CVer知乎賬號和CVer微信公眾號,可以快速了解到最新優質的CV論文,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/240052.html
標籤:其他
上一篇:淺談功分器
