這段時間,因為接觸了紅外攝像頭影像除錯相關的作業,對演算法與影像質量之間的關系與彼此約束有許多困惑和不解。
因為不太了解演算法實作,所以對演算法對影像的要求存在口口相傳的一點了解。比如銳度啦…
對影像質量除錯,與演算法之間的關系也做了如下思考:
假如演算法是基于以前別的專案不同的sensor進行trainning的,是否有必要對新的sensor調出來的影像進行重新trainning?是不是分深度學習和傳統演算法兩種情況?
這里有一個想法,假設影像質量存在一組最佳引數,這個最佳引數可以滿足大部分人看起來滿意。但是這組引數需要除錯出來的一組引數來逼近,也就是我們事先是不知道這組最佳引數的。這時候,不同人或者同一個人的不同影像質量優化結果,所對應的引數,應該是在這個最佳引數周邊分布,可以用正態分布來建模,最佳引數應該是認可概率最高的那組引數。
這時候,如果基于其他sensor的訓練模型,理想結果,該模型可以和這個sensor影像質量的正太分布相匹配。
但是,往往有很大可能,非對應sensor訓練出來的演算法,所匹配的影像質量模型往往有偏差。這時候,可能導致一種后果,也就是,影像質量越好,演算法識別效果越差。
那么又引出一個問題:什么時候應該繼續優化影像效果?什么時候應該鎖定影像效果,需要演算法來適配最好的影像效果?
這里就需要建立一個除錯的共識:機器演算法識別較好的效果,至少是和人眼識別的效果正相關的。而不是人眼識別越好,機器識別越差,朝相反的方向背道而行。我想,最終應該識別的影像,人眼看起來也應該是滿意的。
所以,這里就存在一個問題,每次先將影像質量調到人眼可見的最高,然后讓機器來適配,這是否可行?
理論上,演算法和人眼對影像效果的要求應該同時符合正態分布模型。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/120940.html
標籤:智能硬件
上一篇:stm32
