主頁 >  其他 > 論文解讀---一種新的紅外可見光影像融合演算法

論文解讀---一種新的紅外可見光影像融合演算法

2021-02-23 12:21:17 其他

An infrared and visible image fusion method based on multi-scale transformation and norm optimization

  • 引言
  • 方法論
    • 預融合影像的生成
    • 基于MDLatLRR的影像分解
    • 基礎層與細節層的影像融合
      • 基礎層
      • 細節層
    • 逆變換
  • 總結
  • 對于紅外可見光影像融合的思考

論文:
An infrared and visible image fusion method based on multi-scale transformation and norm optimization
代碼:(如果覺得論文的思想對你們有幫助,請幫我點亮小星星哈哈哈):
LYJ/IVFusion
以下分為三大部分介紹這篇論文:
研究背景以及現存問題:論文的引言部分對當前紅外可見光影像融合研究現狀進行了詳細總結,相信對于剛接觸該方向的同學也可以起到綜述的作用,篇幅有限,在這里就不展開了,
方法論:介紹該融合演算法的步驟,就單純介紹,這一步不做討論,
總結:結合論文實驗部分討論其創新性,

引言

可見影像可以為計算機視覺任務提供最直觀的細節, 但是,由于資料收集環境的影響,可見影像可能無法突出顯示重要目標, 與可見影像不同,紅外影像可以根據熱輻射差異將目標與背景區分開,而不受照明和天氣條件的影響, 但是,紅外影像的局限性在于它們無法提供紋理細節, 因此,僅使用可見影像或紅外影像不能提供足夠的資訊來促進計算機視覺應用,例如各種環境中的目標檢測,識別和跟蹤, 為了解決這個問題,多種紅外和可見光影像融合方法被提出,
文章提出的演算法屬于多尺度變換與范數優化結合的混合演算法,多尺度變換將影像分解為基礎層與細節層,其中基礎層控制著影像目標背景整體對比度,細節層控制著影像中細節資訊,當前融合演算法在基礎層與細節層融合中存在以下問題:
第一:傳統的基礎層“權重分配”融合規則通常使融合影像在源影像中保留高像素強度的特征,而忽略全域對比度,導致融合影像無法在復雜場景(例如,汽車或路燈的夜間情況)中突出目標,
第二:對于細節層的常規融合策略旨在保留更多的源影像細節, 然而,并非所有可見光影像中的細節資訊都是有效的,特別是在復雜的場景中, 因此,通過從可見影像中包含更多細節來提高融合影像的質量并不總是有幫助的,

方法論

這張圖三個紅色部位分別是下面三個標題,
首先對紅外可見影像進行預處理得到預融合影像,接著將紅外影像、可見光影像與預融合影像經影像分解演算法MDLatLRR分解出基礎層與細節層,其中,來自預融合影像的基礎層作為最終融合影像的基礎層,來自紅外可見影像的細節層在預融合影像的協助下融合得到最終融合影像的細節層,
在這里插入圖片描述

預融合影像的生成

預融合影像有兩個作用:
A:提高最終融合影像中目標與背景的對比度,
B:作為細節層融合中消除可見光影像無效細節資訊的參考,
具體來說,預融合處理可視作一個優化問題:由對比度保真項與梯度稀疏約束項構成:
對比度保真項:f表示預融合圖,Ir是紅外影像,
在這里插入圖片描述
我們希望最終融合影像保留紅外影像的目標背景對比度,而不是直接跟紅外影像每個像素值一模一樣 (畢竟紅外影像并不符合人眼視覺感知嘛) ,也就是(f-Ir)大部磁區域不為0,但接近0,即我們認為(f-Ir)應當是高斯分布,采用的是L2范數,
梯度稀疏約束:
在這里插入圖片描述
這一項是預融合影像梯度項,既考慮了紅外影像,也考慮了可見光影像,顯然,在νf-梯度分布上,我們當然希望是梯度可以一模一樣轉移到預融合影像中,也就是大部分值為0,本來用L0范數最直白了,但是L0范數是一個NP問題,所以采用L1范數來作為近似,
綜合起來:
在這里插入圖片描述
令 k = f - Ir - Vis,r = -Vis,u = 2·ρ,可得:f = k+Ir+Vis,如下形式:在這里插入圖片描述
梯度可拆分為水平方向與垂直方向:
在這里插入圖片描述
最后優化函式為:
在這里插入圖片描述
最后應用Split Bregman求該式子最小值k,可得到預融合影像f,

基于MDLatLRR的影像分解

論文中的影像分解演算法參考自論文:MDLatLRR、代碼來自:MDLatLRR
事實上,所謂將影像分解為高頻與低頻、基礎層與細節層的演算法,其實本質上都是拿濾波演算法來進行改造的,比如:導向濾波、最小二乘法濾波、雙邊濾波,
基于MDLatLRR的演算法本質上是利用影像的低秩性來分解影像,
秩的通俗理解:秩就是秩序,看到過別人舉的一個例子:一群人排隊,如果里面的人互相不認識,那么就不會讓對方插隊,此時該隊伍就井然有序 (秩序),這時我們就稱該隊伍的秩序比較好 (高秩),但是如果里面互相認識的人比較多,那么待會就會出現走后門、插隊的現象發生,此時的隊伍就亂成一鍋粥,秩序差,也就是低秩,
線性代數中的秩:表示矩陣行列之間的相關性,行列之間的相關性越高,秩越低,矩陣行或列之間就可以互相表示,引申到影像中,就是在說影像里面的像素結構彼此的相關程度,一幅影像往往是低秩或者近似低秩的,這是因為其中的影像資訊具有很大的相關性,所以一幅自然影像往往可以由其內部少部分資料表示 (這就是影像壓縮),但如果影像存在噪聲,那么存在隨機幅值任意大但是分布稀疏的誤差就會破壞了原有資料的低秩性,

下面的圖片來源于:低秩恢復演算法(影像去噪)
在這里插入圖片描述
上面的LRR將影像中的噪聲E與低秩矩陣DZ分離,低秩矩陣DZ就是經過去噪的影像,基于MDLatLRR的影像分解演算法將上圖中式(13)改造成:多出來的L是顯著系數投影矩陣,即上圖的影像低秩矩陣DZ進一步被拆分為基礎部分和顯著部分,
在這里插入圖片描述
以上是對影像單個尺度進行分解,引申到多尺度變換中即分解多次,每一次以上一次尺度分解得到的基礎層為輸入,如下圖所示:
在這里插入圖片描述

基礎層與細節層的影像融合

基礎層

基礎層來自預融合影像經MDLatLRR影像分解演算法所得的基礎層,

細節層

細節層的融合程序如下:
在這里插入圖片描述
得分圖的生成
對預融合影像與紅外影像、預融合影像與可見影像分別使用滑動視窗計算區域SSIM,得到Score(V-P) Map (可見與預融合影像)與Score(I-P) Map (紅外與預融合影像),
得分圖到權重圖的轉換
得到的兩個得分圖再經由如下式子:
在這里插入圖片描述
轉換為以下權重圖:
在這里插入圖片描述
由于最終權重圖作用于可見影像細節層中,所以權重圖亮度越暗的位置代表著對應位置的可見影像細節資訊權重越低,可以明顯看到,不利于最終融合結果的可見光資訊權重被降低了,
用于細節層融合的優化演算法
該優化程序旨在使可見光影像資訊有效的地方對應在融合細節層中傾向于可見光資訊,在紅外影像資訊有效的地方傾向紅外光資訊,設計出如下優化等式:
在這里插入圖片描述
DF代表最終優化得到的融合細節層、Dir表示來自紅外影像的細節層、Dvis表示來自可見影像的細節層,既然對可見光影像細節層進行了過濾,難免會影響到有效的資訊,所以分別對紅外可見的細節資訊進行了增強,即加入增強系數αir與αvis,增強的思想是自適應區域均方差(公式見論文),ω為上一步得到的權重圖,同樣的,我們希望融合細節層在紅外與可見影像細節中取得一個平衡,即接近0,但不等于0,故采用的還是L2范數,
構建出上述式子后,首先證明其為凸函式,然后利用凸函式的性質: 區域最小值即為全域最小值,
這部分式子推導比較多,下面貼一下論文這部分的程序:
在這里插入圖片描述
以上證明了優化函式為凸函式,以下求解最終優化結果:
在這里插入圖片描述

逆變換

與其他基于多尺度變換一樣,該論文的逆變換也只是簡單將細節層與基礎層的影像相加就行了,
B代表最終的融合基礎層base layer,也就是預融合影像經過4次分解所得到的
D代表最終的融合細節層detail layer,
在這里插入圖片描述

總結

第一:這篇論文與其他論文最大的不同在于融合思想的轉變: 作者認為源影像的資訊并不全是有效資訊,不應該全部放到融合影像中,目前大多數融合論文追求的是融合影像應具有更多源影像的資訊,這可以從其采用的評價指標中看出 ,大多數為有參考影像評價指標(影像結構相似度SSIM、視覺資訊保真度VIF、互資訊MI等),但是紅外可見融合本來就是因為單獨的影像質量不好才需要融合的,我們采用的評價指標大多數為無參考評價指標,從實驗部分可以看出作者的這種思想是有效果的 (尤其對于強光),
在這里插入圖片描述
在這里插入圖片描述在這里插入圖片描述

第二:當前紅外與可見光影像融合的主流觀點是:

紅外光影像目標突出,但細節資訊不夠豐富,可見光影像細節資訊豐富,但目標不夠突出

對于目標突出

當前許多處理是分解紅外可見光影像得到兩個基礎層,然后通過設計權重分配函式,特別的,影像顯著性被引入到該領域中,但是對于可見光影像,顯著并不等于有效,沒錯,最典型的還是強光資訊,所以,既然紅外光影像能夠突出目標,而且是不受影響,是有效的,那我們直接將紅外影像中目標與背景的亮度比保留下來不就行了嗎???

對于細節資訊

可見光影像細節資訊雖然豐富,但由于環境的干擾,并非都是有效資訊,相反,紅外光影像細節資訊雖然不夠豐富,但反映的都是真實資訊,這可以為細節資訊的融合提供幫助,

所以基于上述兩點,作者就提出了兩階段融合策略:
第一階段:預融合,既保留紅外影像目標與背景的亮度比 ( 針對第一點) , 又加入了梯度稀疏約束 (針對第二點,由于紅外影像細節資訊較少,所以適當加入一些可見光影像細節資訊來彌補,引數ρ可用于調節所加入的可見光影像細節資訊的量),
第二階段:細節層融合,以預融合影像為基準,分別與紅外、可見影像進行區域SSIM評分,下圖可明顯看到強光部分在最后參與融合的權重極低,在最終融合結果中可以看到,強光資訊基本被消除,最后,我們再比較一下采用了同種影像分解演算法MDLatLRR,但不同融合規則的方法—MDLatLRR,以證明我們的兩階段融合策略是有效的,
在這里插入圖片描述

對于紅外可見光影像融合的思考

當前該領域雖然出現了許多基于深度學習的融合方法,但基于深度學習的融合方法并沒有比傳統方法好多少,原因在于這是一個無監督任務,損失函式較難設計,
如若還想在這個方向繼續做下去,
我從個人看法提出如下幾個方向,權當拋磚引玉:
第一:損失函式的設計是一個挑戰,結合感知損失的IFCNN、結合SSIM的DenseFuse(這篇論文挺有趣的,使用COCO資料集訓練了一個可用于影像分解與重建的網路,然后在中間加入人工設計規則進行融合),
第二:從網路結構入手,比如2019年的對抗網路FusionGAN,2020年的雙對抗網路DDcGAN
第三:其實本文存在的缺點就是兩階段融合所使用的時間較長,時間花費主要在于區域SSIM的計算,也就是對可見光影像資訊有效性的評分,不知可否考慮轉化為基于深度學習的方法呢?即自己學習給可見影像資訊打分,在聯想得的遠一些,之前看到過一篇紅外可見融合來進行行人檢測的(Illumination-aware faster R-CNN for robust multispectral pedestrian
detection),其探究了低光跟強光場景下,紅外可見融合中哪個貢獻更大,
第四:模仿傳統演算法中的視覺顯著性,加入注意力模塊CBAM
還可以考慮一下分組卷積,顯著性檢測論文Deep Salient Object Detection With Contextual
Information Guidance中證明了分組卷積有利于突出重要目標,事實上確實是有道理的,傳統卷積將多通道特征組合在一起處理,可能會淹沒掉某些通道的特征,
第四:針對實際應用,紅外可見光融合之后進行分割、檢測,比如融合分割的MFNet與RTFNet
第五:也可以從評價指標入手,由于紅外可見影像融合不存在真實可對比的融合影像,有參考影像評價指標通常只取其中一方影像為參考或兩方取平均,可是我們正是因為源影像質量不好才需要融合的啊,所以也許我們可以改進一下評價指標,設計專門針對紅外可見影像融合的評價指標,
第六:影像分割演算法UNet網路結構采用了是4次下采樣,再上采樣恢復,但是UNet++作者通過做實驗得出結論,4次下采樣并不是對所有分割任務都有效,最后作者抓住這一點,設計了一個基于UNet的新網路,即讓對應網路自己學習對應任務,需要幾次下采樣,最后還可以有的分割任務還可以剪枝,引申到紅外可見融合尺度中,每次基于多尺度變換的傳統融合演算法,分解尺度總是固定的,大部分為4次分解,然后就開始對應融合了,而事實上并沒有誰證明了分解4次再融合就一定是最好的,所以,我們是不是也可以通過一些實驗,甚至可以結合深度學習,加入多種尺度,讓演算法針對不同場景的影像自適應找到一種合適的融合尺度呢?

Emmmm,就先暫時想到這里吧,有什么想法再給大家分享,

最后的最后,如果覺得本文不錯,那就來個:點贊、關注、收藏吧哈哈哈,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/262552.html

標籤:其他

上一篇:[NOIP2008 普及組] ISBN 號碼

下一篇:什么是金字塔原理?

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more