RetinaNet,SSD,YOLOv3,Faster R-CNN等都是Anchor-based的檢測器,即需要預定義的Anchor boxes來進行訓練,FCOS是一種Anchor-free和Proposal-free的檢測器,即不需要預定義Anchor boxes來進行訓練,從而節省了對計算資源的占用,
根據我的理解,FCOS和Faster R-CNN的區別主要表現在:
(1) Faster R-CNN是每個點提出N個Proposal,N一般等于9(預設了3種長寬比例,3種尺寸因此是9個Proposal),每一個Proposal的類別如何確定呢?就需要計算Proposal和GT Box的IOU了,IOU達到一定的程度,Proposal就算是這個GT Box的類,要求這個Proposal回歸到這個GT Box;而FCOS每個點只提出一個Proposal,這個Proposal的類別如何確定?就是這個點在哪一個GT Box里面,它提出的Proposal就屬于哪一個GT Box的類,當然也要求這個Proposal回歸到這個GT Box,但是感覺Faster R-CNN的分類更好訓練一些,畢竟Proposal和GT Box有比較大的IOU,FCOS靠近GT Box中心的點的類還比較好訓練,距離中心比較遠的點估計不好訓練吧,

(2) FCOS多出來一個Center-ness:

這是因為距離目標中心越遠的位置預測出的Proposal質量越低,所以FCOS增加了一個分支預測Center-ness,越靠近GT Box的中心,這個Center-ness的值就越接近1,

預測的時候結合對應的分類分數以及Center-ness的值來對Proposal進行排序,從而抑制了距離目標中心越遠的位置預測出的Proposal,這種方法是很巧妙的,值得借鑒,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/65633.html
標籤:其他
