GBD-Net
明天考試今天簡單理解理解吧
演算法背景
物體檢測中,不同大小和解析度的多個proposal的特征細節在進行分類的時候是互補的,來自這些proposal的背景關系特征的整合是目標檢測中的基本問題,在本文中,作者提出了一種門控雙向神經網路(GBD網路),用于在特征學習和特征提取的程序中在來自不同proposal的特征之間傳遞資訊,這種資訊傳遞可以通過兩個方向上相鄰的proposal之間的卷積來實作,并且可以在不同層之中進行,
演算法原理

在不同解析度的proposal之間根據不同的影像實體來控制傳遞資訊是非常必要的,藍色框代表GT,紅色框是候選框,由于(a)中相似的區域特征和(b)中對遮擋區域的忽略,很難對proposal進行分類,
作者的思路就是來自不同解析度和proposal的特征驗證彼此的存在,例如兔子耳朵在區域區域的存在有助于加強兔子頭的存在,而兔子上半身在更大的context區域存在也有助于驗證兔子頭的存在,因此作者建議具有不同解析度和proposal的特征應該在多個層中互相傳遞資訊,以便于在特征學習和特征提取程序中共同驗證,
網路結構

GBD-Net采集Context資訊的方式是直接在目標視窗基礎上放大視窗以獲得更多的context資訊,或縮小視窗以保留更多的目標細節,以此得到多個support region,雙向連接的網路讓不同尺度和解析度的資訊在每個support region之間相互傳遞,從而綜合學習到最優的特征,然而如研究動機中所說,并非所有的背景關系資訊都能給決策帶來“正能量”,所以在雙向互通的連接上都加了一個“門”,以此控制context資訊的相互傳播,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/245289.html
標籤:其他
