跟我學Python影像處理丨帶你掌握傅里葉變換原理及實作-有解無憂

摘要：傅里葉變換主要是將時間域上的信號轉變為頻率域上的信號，用來進行影像除噪、影像增強等處理，

本文分享自華為云社區《[Python影像處理] 二十二.Python影像傅里葉變換原理及實作》，作者：eastmount，

本文主要講解影像傅里葉變換的相關內容，在數字影像處理中，有兩個經典的變換被廣泛應用——傅里葉變換和霍夫變換，其中，傅里葉變換主要是將時間域上的信號轉變為頻率域上的信號，用來進行影像除噪、影像增強等處理，

影像傅里葉變換原理

傅里葉變換（Fourier Transform，簡稱FT）常用于數字信號處理，它的目的是將時間域上的信號轉變為頻率域上的信號，隨著域的不同，對同一個事物的了解角度也隨之改變，因此在時域中某些不好處理的地方，在頻域就可以較為簡單的處理，同時，可以從頻域里發現一些原先不易察覺的特征，傅里葉定理指出“任何連續周期信號都可以表示成（或者無限逼近）一系列正弦信號的疊加，”

下面參考李老師“Python+OpenCV影像處理”中的一個案例，非常推薦同學們去學習，如下圖所示，他將某飲料的制作程序的時域角度轉換為頻域角度，

繪制對應的時間圖和頻率圖如下所示：

傅里葉公式如下，其中w表示頻率，t表示時間，為復變函式，它將時間域的函式表示為頻率域的函式f(t)的積分，

傅里葉變換認為一個周期函式（信號）包含多個頻率分量，任意函式（信號）f(t)可通過多個周期函式（或基函式）相加合成，從物理角度理解，傅里葉變換是以一組特殊的函式（三角函式）為正交基，對原函式進行線性變換，物理意義便是原函式在各組基函式的投影，如下圖所示，它是由三條正弦曲線組合成，

傅里葉變換可以應用于影像處理中，經過對影像進行變換得到其頻譜圖，從譜頻圖里頻率高低來表征影像中灰度變化劇烈程度，影像中的邊緣信號和噪聲信號往往是高頻信號，而影像變化頻繁的影像輪廓及背景等信號往往是低頻信號，這時可以有針對性的對影像進行相關操作，例如影像除噪、影像增強和銳化等，

二維影像的傅里葉變換可以用以下數學公式（15-3）表達，其中f是空間域（Spatial Domain）)值，F是頻域（Frequency Domain）值

對上面的傅里葉變換有了大致的了解之后，下面通過Numpy和OpenCV分別講解影像傅里葉變換的演算法及操作代碼，

二.Numpy實作傅里葉變換

Numpy中的 FFT包提供了函式 np.fft.fft2()可以對信號進行快速傅里葉變換，其函式原型如下所示，該輸出結果是一個復數陣列（Complex Ndarry），

fft2(a, s=None, axes=(-2, -1), norm=None)

a表示輸入影像，陣列狀的復雜陣列
s表示整數序列，可以決定輸出陣列的大小，輸出可選形狀（每個轉換軸的長度），其中s[0]表示軸0，s[1]表示軸1，對應fit(x,n)函式中的n，沿著每個軸，如果給定的形狀小于輸入形狀，則將剪切輸入，如果大于則輸入將用零填充，如果未給定’s’，則使用沿’axles’指定的軸的輸入形狀
axes表示整數序列，用于計算FFT的可選軸，如果未給出，則使用最后兩個軸，“axes”中的重復索引表示對該軸執行多次轉換，一個元素序列意味著執行一維FFT
norm包括None和ortho兩個選項，規范化模式（請參見numpy.fft），默認值為無

Numpy中的fft模塊有很多函式，相關函式如下：

#計算一維傅里葉變換
numpy.fft.fft(a, n=None, axis=-1, norm=None)
#計算二維的傅里葉變換
numpy.fft.fft2(a, n=None, axis=-1, norm=None)
#計算n維的傅里葉變換
numpy.fft.fftn()
#計算n維實數的傅里葉變換
numpy.fft.rfftn()
#回傳傅里葉變換的采樣頻率
numpy.fft.fftfreq()
#將FFT輸出中的直流分量移動到頻譜中央
numpy.fft.shift()

下面的代碼是通過Numpy庫實作傅里葉變換，呼叫np.fft.fft2()快速傅里葉變換得到頻率分布，接著呼叫np.fft.fftshift()函式將中心位置轉移至中間，最終通過Matplotlib顯示效果圖，

# -*- coding: utf-8 -*-
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
#讀取影像
img = cv.imread('test.png', 0)
#快速傅里葉變換演算法得到頻率分布
f = np.fft.fft2(img)
#默認結果中心點位置是在左上角,
#呼叫fftshift()函式轉移到中間位置
fshift = np.fft.fftshift(f) 
#fft結果是復數, 其絕對值結果是振幅
fimg = np.log(np.abs(fshift))
#展示結果
plt.subplot(121), plt.imshow(img, 'gray'), plt.title('Original Fourier')
plt.axis('off')
plt.subplot(122), plt.imshow(fimg, 'gray'), plt.title('Fourier Fourier')
plt.axis('off')
plt.show()

輸出結果如圖15-2所示，左邊為原始影像，右邊為頻率分布圖譜，其中越靠近中心位置頻率越低，越亮（灰度值越高）的位置代表該頻率的信號振幅越大，

三.Numpy實作傅里葉逆變換

下面介紹Numpy實作傅里葉逆變換，它是傅里葉變換的逆操作，將頻譜影像轉換為原始影像的程序，通過傅里葉變換將轉換為頻譜圖，并對高頻（邊界）和低頻（細節）部分進行處理，接著需要通過傅里葉逆變換恢復為原始效果圖，頻域上對影像的處理會反映在逆變換影像上，從而更好地進行影像處理，

影像傅里葉變化主要使用的函式如下所示：

#實作影像逆傅里葉變換，回傳一個復數陣列
numpy.fft.ifft2(a, n=None, axis=-1, norm=None)
#fftshit()函式的逆函式，它將頻譜影像的中心低頻部分移動至左上角
numpy.fft.fftshift()
#將復數轉換為0至255范圍
iimg = numpy.abs(逆傅里葉變換結果)

下面的代碼分別實作了傅里葉變換和傅里葉逆變換，

# -*- coding: utf-8 -*-
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
#讀取影像
img = cv.imread('Lena.png', 0)
#傅里葉變換
f = np.fft.fft2(img)
fshift = np.fft.fftshift(f)
res = np.log(np.abs(fshift))
#傅里葉逆變換
ishift = np.fft.ifftshift(fshift)
iimg = np.fft.ifft2(ishift)
iimg = np.abs(iimg)
#展示結果
plt.subplot(131), plt.imshow(img, 'gray'), plt.title('Original Image')
plt.axis('off')
plt.subplot(132), plt.imshow(res, 'gray'), plt.title('Fourier Image')
plt.axis('off')
plt.subplot(133), plt.imshow(iimg, 'gray'), plt.title('Inverse Fourier Image')
plt.axis('off')
plt.show()

輸出結果如圖15-4所示，從左至右分別為原始影像、頻譜影像、逆傅里葉變換轉換影像，

四.OpenCV實作傅里葉變換

OpenCV 中相應的函式是cv2.dft()和用Numpy輸出的結果一樣，但是是雙通道的，第一個通道是結果的實數部分，第二個通道是結果的虛數部分，并且輸入影像要首先轉換成 np.float32 格式，其函式原型如下所示：

dst = cv2.dft(src, dst=None, flags=None, nonzeroRows=None)

src表示輸入影像，需要通過np.float32轉換格式
dst表示輸出影像，包括輸出大小和尺寸
flags表示轉換標記，其中DFT _INVERSE執行反向一維或二維轉換，而不是默認的正向轉換；DFT _SCALE表示縮放結果，由陣列元素的數量除以它；DFT _ROWS執行正向或反向變換輸入矩陣的每個單獨的行，該標志可以同時轉換多個矢量，并可用于減少開銷以執行3D和更高維度的轉換等；DFT _COMPLEX_OUTPUT執行1D或2D實陣列的正向轉換，這是最快的選擇，默認功能；DFT _REAL_OUTPUT執行一維或二維復數陣列的逆變換，結果通常是相同大小的復數陣列，但如果輸入陣列具有共軛復數對稱性，則輸出為真實陣列
nonzeroRows表示當引數不為零時，函式假定只有nonzeroRows輸入陣列的第一行（未設定）或者只有輸出陣列的第一個（設定）包含非零，因此函式可以處理其余的行更有效率，并節省一些時間；這種技術對計算陣列互相關或使用DFT卷積非常有用

注意，由于輸出的頻譜結果是一個復數，需要呼叫cv2.magnitude()函式將傅里葉變換的雙通道結果轉換為0到255的范圍，其函式原型如下：

cv2.magnitude(x, y)

x表示浮點型X坐標值，即實部
y表示浮點型Y坐標值，即虛部
最終輸出結果為幅值，即：

完整代碼如下所示：

# -*- coding: utf-8 -*-
import numpy as np
import cv2
from matplotlib import pyplot as plt
#讀取影像
img = cv2.imread('Lena.png', 0)
#傅里葉變換
dft = cv2.dft(np.float32(img), flags = cv2.DFT_COMPLEX_OUTPUT)
#將頻譜低頻從左上角移動至中心位置
dft_shift = np.fft.fftshift(dft)
#頻譜影像雙通道復數轉換為0-255區間
result = 20*np.log(cv2.magnitude(dft_shift[:,:,0], dft_shift[:,:,1]))
#顯示影像
plt.subplot(121), plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(result, cmap = 'gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()

輸出結果如圖15-5所示，左邊為原始“Lena”圖，右邊為轉換后的頻譜影像，并且保證低頻位于中心位置，

五.OpenCV實作傅里葉逆變換

在OpenCV 中，通過函式cv2.idft()實作傅里葉逆變換，其回傳結果取決于原始影像的型別和大小，原始影像可以為實數或復數，其函式原型如下所示：

dst = cv2.idft(src[, dst[, flags[, nonzeroRows]]])

src表示輸入影像，包括實數或復數
dst表示輸出影像
flags表示轉換標記
nonzeroRows表示要處理的dst行數，其余行的內容未定義（請參閱dft描述中的卷積示例）

完整代碼如下所示：

# -*- coding: utf-8 -*-
import numpy as np
import cv2
from matplotlib import pyplot as plt
#讀取影像
img = cv2.imread('Lena.png', 0)
#傅里葉變換
dft = cv2.dft(np.float32(img), flags = cv2.DFT_COMPLEX_OUTPUT)
dftshift = np.fft.fftshift(dft)
res1= 20*np.log(cv2.magnitude(dftshift[:,:,0], dftshift[:,:,1]))
#傅里葉逆變換
ishift = np.fft.ifftshift(dftshift)
iimg = cv2.idft(ishift)
res2 = cv2.magnitude(iimg[:,:,0], iimg[:,:,1])
#顯示影像
plt.subplot(131), plt.imshow(img, 'gray'), plt.title('Original Image')
plt.axis('off')
plt.subplot(132), plt.imshow(res1, 'gray'), plt.title('Fourier Image')
plt.axis('off')
plt.subplot(133), plt.imshow(res2, 'gray'), plt.title('Inverse Fourier Image')
plt.axis('off')
plt.show()

輸出結果如圖15-6所示，第一幅圖為原始“Lena”圖，第二幅圖為傅里葉變換后的頻譜影像，第三幅圖為傅里葉逆變換，頻譜影像轉換為原始影像的程序，

六.總結

傅里葉變換的目的并不是為了觀察影像的頻率分布（至少不是最終目的），更多情況下是為了對頻率進行過濾，通過修改頻率以達到影像增強、影像去噪、邊緣檢測、特征提取、壓縮加密等目的，下一篇文章，作者將結合傅里葉變換和傅里葉逆變換講解它的應用，

點擊關注，第一時間了解華為云新鮮技術~

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/509418.html

標籤：Python

上一篇：創建Django專案

下一篇：Django 使用VScode 創建工程