整個YOLOX原始碼的學習一定要按照以下順序才能整體串起來:Backbone->FPN->Head->->資料讀入原始碼->資料增強原始碼->loss計算原始碼->simOTA原始碼->demo.py腳本->train.py腳本,而該系列博文也遵循該順序來逐行分析代碼,注意是逐行,包括python語法,tensor維度和逐行代碼的作用及應用,其實網路結構本沒有任何神秘的地方,都是一些模塊堆疊起來的,你完全可以沒有任何理由的修改任何一個模塊,看完這個系列后自己完全可以隨便的去對任何網路結構做手腳,而不僅僅局限于一個調參者,
本篇講的是YOLOX中的mixup資料增強,其程序就是將兩張圖縮放,翻轉或mosaic資料增強后按一定比例混合,同時將gtbox進行混合,代碼只有六七十行,是這個系列最簡單的一節,
將YOLOX中mixup增強的代碼定位到yolox\data\datasets\mosaicdetection.py的mixup()方法,該方法中,origin_img引數代表mosaic增強后的影像,origin_labels引數代表mosaic增強后的標簽,input_dim引數代表預設的輸入尺寸,如(640, 640),
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/423952.html
標籤:AI
上一篇:3D小紅花的繪制原理
