Memory Enhanced Global-Local Aggregation for Video Object Detection
1、概述
在視頻物體檢測任務中,由于相機失焦、物體遮擋等問題,僅基于影像的目標檢測器很可能達不到令人滿意的效果,針對此類問題,微軟亞洲研究院提出了基于記憶增強的全域-區域整合網路(Memory Enhanced Global-Local Aggregation, MEGA),它可以在只增加非常小的計算開銷的前提下,整合大量的全域資訊和區域資訊來輔助關鍵幀的檢測,從而顯著地提升了視頻物體檢測器的性能,在廣泛使用的 ImageNet VID 資料集中,此方法達到了截至目前的最好結果,
2、安裝
2.1 Requirements:
- PyTorch 1.3 (1.4 may cause some errors.)
- torchvision from master
- cocoapi
- yacs
- matplotlib
- GCC >= 4.9
- OpenCV
- CUDA >= 9.2
2.2 安裝步驟
# first, make sure that your conda is setup properly with the right environment
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/204173.html
標籤:其他
