基于FPGA的改進實時影像增強演算法的設計與實作-有解無憂

當今社會，監控技術應用十分廣泛，但是很多監控設備大都處于戶外作業環境，而外界環境的多變性增加了監控的難度，典型的情況就是天氣因素，比如大霧，陰天等等，這些因素會增加監控的難度，甚至使系統無法正常作業，為了保證監控能夠在各種天氣條件下正常進行，研究影像增強技術具有重大意義，影像增強是一種基本的影像預處理手段，其目的是為了改善影像的質量，針對給定影像的模糊狀況以及它的應用場合，有目的的強調影像的整體或區域特性，提高影像可辨識度，改善人對影像的視覺效果，讓觀察者得到直觀清晰的、適合于分析的依據，使影像更有利于觀察和后期的分析處理，一般通過對影像的某些特征進行強調突出，從而顯示我們有需要的資訊，提高影像的使用價值和應用價值[1]，不過值得注意的是，影像增強并不意味著能增加原始影像的資訊，甚至會損失一些資訊，但影像增強的結果卻能加強對特定資訊的識別能力，使影像中我們感興趣的特征得以加強，

大多數成像系統具有一定的亮度范圍，但實際情況中，由于各種因素的影響，影像常常表現為對比度不強、影像模糊不清，影像細節無法分辨的情況，所以我們需要通過某些演算法來調整對比度，亮度，增大影像的動態范圍，擴展影像對比度，改善影像的視覺效果，并最大程度上突出影像的細節資訊，影像增強技術一般可分為空域演算法和頻域演算法兩類，空域演算法是指直接對影像灰度級做運算，頻域演算法則通過FFT首先將影像變換到頻域，然后在頻域進行處理，對影像的變換系數值進行某種修正，是一種間接增強的演算法[2]，

2.1 點運算影像增強

點運算處理是一種簡單的影像增強演算法處理技術，它通過改變像素點的灰度值來實作影像增強的效果，是影像增強的重要手段之一，通常情況下，點運算可以分為線性點運算和非線性點運算兩類，

線性點運算：輸出灰度級與輸入灰度級呈線性關系，其一般可以用如下的式子表示：

當a =1,b=0時，輸出影像與輸入影像相同，

當a>1時，輸出影像的對比度增強，

當a<1時，輸出影像的對比度減弱，

當a =1,b≠0時，輸出影像的整體像素點灰度級將增大或減小，

非線性運算：輸出灰度級與輸入灰度級呈非線性關系，其分為對數形式和指數形式，其運算式如下：

當原影像的灰度動態范圍較大的使用對數形式，

當需要對影像的高灰度區給予較大的擴展時使用，

點運算處理的最大有點就是處理簡單，即使在硬體上也非常方便的實作，但是其功能有限，無法處理影像的一些細節資訊，

我們將在MATLAB中來實作Retinex演算法，

>首先將圖片型別轉換為double型：

IM=double(image);

>將輸入的影像放在對數域中處理：

I=log(IM+1);

>將增強后的結果影像中的像素點的灰度值都初始化為一個常數：

const=mean2(image);

r(i,j)=const;

>在水平位置上，令h=width/2，計算與之間的相對明暗關系：

relation(i,j)=I(i,j+h)-I(i,j);

r(i,j)=r(i,j)-relation(i,j);

r(i,j+h)=r(i,j+h)+relation(i,j);

>在垂直位置上，令l=height/2，計算與之間的相對明暗關系：

relation(i,j)=I(i+l,j)-I(i,j);

r(i,j)=r(i,j)-relation(i,j);

r(i+l,j)=r(i+l,j)+relation(i,j);

>最后輸出：

mi=min(min(r));

ma=max(max(r));

Channel_out=(r-mi).*255/(ma-mi);

下面我們對多組測驗圖片進行仿真，其結果如下所示：

（c）（d）

（e）（f）

圖1 retinex增強前后的效果對比

圖3.1中a，c，e為增強前的模糊影像，b，d，f為增強后的影像，很明顯，影像得到了增強，很多細節部分能夠看的更加清楚，影像組中比較模糊的影像通過增強演算法之后也變得更加的清晰了，上面的仿真我們只是從定性上分析了影像增強的功能，下面我們將通過結果分析定量上分析影像增強的具體變化，從而深入了解影像retinex增強演算法的功能，

為了更進一步分析影像增強前后的影像變化，我們將對仿真結果進行分析，通常情況下，我們需要分析直方圖，熵值，

·灰度直方圖

任意選取一個圖片，通過其灰度直方圖進行增強分析，如圖2所示，

(a)增強前的影像和影像灰度直方圖

(b)增強后的影像和影像灰度直方圖

圖2灰度直方圖

通過上面的直方圖，我們可以看到增強前，直方圖幾種在100~200的范圍內，而且值的變化比較快，通過增強處理后，直方圖的值范圍變寬，而且變化變得更加的緩慢，這樣從視覺上看影像顯的更加的柔和，

·熵

影像的熵值反映了影像的資訊量，熵越大，資訊量就越大，那么對應的影像的細節越豐富，下面我們對增強前后的影像計算其熵，

我們分別計算三組測驗圖片的熵，其計算結果如表1所示：

表1 影像熵值

影像	增強前的熵	增強后的熵
01.jpg	11.1352	13.4288
02.jpg	10.9280	12.9896
03.jpg	9.9702	12.8364

通過上表結果可知，通過影像增強之后，影像的熵明顯比增強前大，這說明影像增強對影像的細節有明顯的改善，

4.1 系統總體結構

本系統我們將在Altera公司的FPGA下開發，使用的軟體為QuartusII，系統主要包括串口接收模塊，影像存盤模塊，影像處理模塊和影像輸出模塊，系統的總體結構如下圖所示，

圖3 系統總體結構

其中影像處理模塊包括對數模塊，均值模塊，相關求解模塊，運算結果輸出模塊，本文我們首先將重點介紹影像處理模塊的各個功能，

本系統影像是通過串口輸入到FPGA中的，串口我們采用的是8位串行輸入，即每個串行信號輸入一個像素點，而對于彩色影像，則一個串行信號輸入R，G，B中一個通道的像素資訊，由于FPGA中資源有限，我們不可能像在MATLAB中做大規模的矩陣運算，我們需要修改該演算法，使其以流水線的方式在FPGA中正常運行，通常在FPGA中，我們將采用如下的結構對Retinex演算法進行實作，

圖4 FPGA硬體實作總體結構

從上面的結構，我們可以看到，此系統主要包括對數，自然指數以及亮度估計三個主要模塊，下面我們逐次進行介紹，

本系統考慮到DE2系統資源以及LCD顯示的問題，我們統一使用128*128像素的圖片資源進行設計與實作，圖片像素通過串口進入FPGA，存入SDRAM中，按照地址，存盤是按順序依次排列的，我們在發送影像的時候，按每行一次發送，則在MATLAB中對于某個像素點坐標（i，j），其對應的SDRAM地址為：128i+j-128，比如第2行第3列的像素點，其坐標則為131，這樣我們就可以對影像進行操作了，

我們通過查找表在FPGA中實作對數求解，由于影像的像素值在0~255之間，所以我們將輸入的數值作為地址，而地址中的值儲存對數結果，而對于對數結果的小數部分則通過放大的辦法使其得到整形，然后在最后的運行結果除以對數部分擴大的倍數即可，本系統我們將求對數的值擴大2^9倍，那么其他資料也將擴大2^9倍，擴展后的對數結果其運行位寬為12位，

其仿真波形如圖4所示，

圖4 log仿真結果

如圖4所示，當輸入的是1的時候，其地址為0，其對數值為0，當輸入的值為2，其地址為1，對應的值為0.6931，擴大2^9后值為354.8672，即仿真結果中的355，所以對數結果正確，

然后對自然指數進行查找表設計，由于影像中的像素值最大為255，所以在求指數查找表的時候，其指數最大為log(255)=5.5413，由于在求對數的時候，我們將數值擴到了2^9.即512倍，所以我們對應的指數最大值為5.5413*512=2837，即地址應該從0~2837，

其仿真波形如下圖5所示，