數字影像處理(二)—— 影像數字化特征介紹
- 前言
- 一、影像的數字化
- 數字影像的表示
- 影像數字化程序
- 1. 采樣
- 2. 量化
- 3. 采樣與量化的作用效果
- 影像數字化設備
- 二、數字影像處理演算法的形式
- 基本功能形式
- 幾種具體演算法形式
- 1. 區域處理
- 鄰域
- 點處理
- 大局處理
- 2. 迭代處理
- 3. 跟蹤處理
- 4. 視窗處理和模板處理
- 5.串行處理和并行處理
- 三、影像的特征與噪聲
- (一)特征提取與特征空間
- 1.特征提取
- 2.特征空間
- (二) 影像噪聲
- 1. 噪聲種類
- 2. 噪聲特征
- 3. 噪聲的模型
- 4. 影像系統常見的噪聲
- 四、影像的資料結構
- 1. 組合方式
- 2. 位元面方式
- 3.分層結構
- 4. 樹結構
- 5.多重影像資料存盤
- 五、影像檔案格式
- 1.RAW格式
- 2.BMP格式
- 3.GIF
- 4.TIFF檔案
前言
本文將介紹數字影像有關的屬性、特征等,對各型別檔案影像進行相應了解,對數字影像的資料結構、演算法形式進行介紹,明白影像噪聲與特征提取
一、影像的數字化
影像數字化是將一幅畫面轉化成計算機能處理的形式——數字影像的程序,

就是把一幅圖畫分割成如圖的一個個小區域(像元或像素),并將各小區域灰度用整數來表示,形成一幅點陣式的數字影像,它包括采樣和量化兩個程序,
像素的屬性=( 位置,灰度/顏色)
數字影像的表示
數字影像用矩陣來描述:以一幅數字影像F左上角像素中心為坐標原點,一幅m × n的數字影像用矩陣表示為:

數字影像根據灰度級數的差異可分為:
黑白影像、灰度影像和彩色影像



影像數字化程序
1. 采樣
采樣:將空間上連續的影像變換成離散點的操作稱為采樣,
采樣間隔和采樣孔徑的大小是兩個很重要的引數,
- 采樣間隔:
當對影像進行實際的抽樣時,怎樣選擇各抽樣點的間隔是個非常重要的問題,影像包含何種程度的細微的深淡變化,取決于希望實際反映影像的程度(還原度),
- 采樣孔徑:


2. 量化
量化:將像素灰度轉換成離散的整數值的程序,
一幅數字影像中不同灰度值的個數稱為灰度級,用G表示,一般數字影像灰度級數 G 為 2 的整數冪,即
G
=
2
𝑔
G = 2^𝑔
G=2g
,g 為量化 bit 數,若一幅數字影像的量化灰度級數
G
=
256
=
2
8
G = 256 = 2^8
G=256=28 級,灰度值范圍0-255,常稱為8bit量化,
影像資料量:一幅 M×N、灰度級數為 G 的影像所需的存盤空間 M × N × g(bit)為影像資料量,
- 數字化方式可分為均勻采樣、量化和非均勻采樣、量化,
所謂“均勻”,指的是采樣、量化為等間隔方式,影像數字
化一般采用均勻采樣和均勻量化方式,
非均勻采樣是根據圖象細節的豐富程度改變采樣間距,細節
豐富的地方,采樣間距小,否則間距大,
非均勻量化是對影像層次少的區域采用間隔大量化,而對影像層次豐富的區域采用間隔小量化,
采用非均勻采樣與量化,均會使問題復雜化,因此很少采用
3. 采樣與量化的作用效果
采樣間隔越小,所得影像像素數越多,空間解析度高,影像質量好,但資料量大;
采樣間隔越大,所得影像像素數越少,空間解析度低,質量差;
下影像素數從 256×256 遞減至 8×8

量化等級越多,所得影像層次越豐富,灰度解析度越高,質量越好,但資料量大;
量化等級越少,影像層次欠豐富,灰度解析度低,質量變差,會出現假輪廓現象,但資料量小,
下圖為采樣間距相同時灰度級數從256逐次減少為64、16、8、4、2所得影像

影像數字化設備
數字化器必須能夠將影像劃分為若干像素并分別給它們地址,能夠度量每一像素的灰度并量化為整數,能夠將這些整數寫入存盤設備,
A.采樣孔:保證單獨觀測特定的像素而不受其它部分的影響,
B.影像掃描機構:使采樣孔按預先確定的方式在影像上移動,
C.光傳感器:通過采樣孔測量影像的每一個像素的亮度,
D.量化器:將傳感器輸出的連續量轉化為整數值,
E.輸出存盤體:將像素灰度值存盤起來,它可以是固態存盤器,或磁盤等,
常用的數字化器是掃描儀、數碼相機和數碼攝像機



| 項 目 | 內 容 |
|---|---|
| 空間解析度 | 單位尺寸能夠采樣的像素數,由采樣孔徑與間距的大小和可變范圍決定, |
| 灰(色)度解析度 | 量化為多少等級(位深度),顏色數(色深度) |
| 影像大小 | 儀器允許掃描的最大圖幅 |
| 量測特征 | 數字化器所測量和量化的實際物理引數及精度 |
| 掃描速度 | 采樣資料的傳輸速度 |
| 噪聲 | 數字化器的噪聲水平(應當使噪聲小于影像內的反差) |
| 其他 | 黑白/彩色,價格,操作性能 |
二、數字影像處理演算法的形式
基本功能形式
按影像處理的輸出形式,影像處理的基本功能可分為三種形式,
1)單幅影像 → 單幅影像

2)多幅影像 →單幅影像

3)單(或多)幅影像→ 數字或符號等

幾種具體演算法形式
1. 區域處理
鄰域
對于任一像素(i,j),該像素周圍的像素構成的集合{(i+p,j+q),p、q取合適的整數},叫做該像素的鄰域,如圖,

常用的鄰域如圖,分別表示中心像素的4-鄰域、8-鄰域,

對輸入影像IP(i,j)處理時,某一輸出像素JP(i,j)值由輸入圖
像像素(i,j)及其鄰域N(IP(i,j))中的像素值確定,這種處理稱為
區域處理,

區域處理的計算運算式為

例如 對一幅圖象采用3×3模板進行卷積運算,

點處理
在區域處理中,當輸出值JP(i,j)僅與IP(i,j)有關,則稱為點
處理,

點處理的計算運算式為:

大局處理
在區域處理中,輸出像素JP(i,j)的值取決于輸入影像大范圍或全部像素的值,這種處理稱為大局處理,

大局處理計算運算式為:

2. 迭代處理
反復對影像進行某種運算直至滿足給定的條件,從而得到輸出影像的處理形式稱為迭代處理,影像的細化處理程序如圖:

3. 跟蹤處理
選擇滿足適當條件的像素作為起始像素,檢查輸入影像和已
得到的輸出結果,求出下一步應該處理的像素,進行規定的處理,然后決定是繼續處理下面的像素,還是終止處理,這種處理形式稱為跟蹤處理
4. 視窗處理和模板處理
對影像的處理,一般采用對整個畫面進行處理,但也有只對
畫面中特定的部分進行處理的情況,這種處理方式的代表有視窗處理和模板處理,
單獨對影像中選定的矩形區域內的像素進行處理的方式叫做視窗處理

希望單獨處理任意形狀的區域時,可采用模板處理,
模板:任意形狀的區域;
模板平面:一個和處理影像相同大小的二維陣列,用來存盤模板資訊,一般是一幅二值影像;
模板處理:邊參照模板平面邊對圖象進行某種操作

若模板成矩形區域,則與視窗處理具有相同的效果,但視窗處理與模板處理不同之處是后者必須設定一個模板平面
5.串行處理和并行處理
①串行處理
后一像素輸出結果依賴于前面像素處理的結果,并且只能依次處理各像素而不能同時對各像素進行相同處理的一種處理形式,
特點:用輸入影像的第(i,j)像素鄰域的像素值和輸出影像(i,j)以前像素的處理結果計算輸出影像(i,j)像素的值,
處理演算法要按一定順序進行,
②并行處理
對影像內的各像素同時進行相同形式運算的一種處理形式,
特點:輸出影像像素(i,j)的值,只用輸入影像的(i,j)像素的鄰域像素進行計算,各輸出值可以獨立進行運算
三、影像的特征與噪聲
(一)特征提取與特征空間
- 影像的特征類別
1.自然特征
①光譜特征
②幾何特征
③時相特征 - 人工特征
①直方圖特征
②灰度邊緣特征
③線、角點、紋理特征
從灰度直方圖能獲取影像哪些資訊?
以灰度級為橫坐標,頻率為縱坐標,繪制頻率同灰度級的關系圖就是一幅灰度影像的直方圖,它反映了一幅影像中各灰度級像素出現的頻率與灰度級的關系和影像灰度分布的狀況;灰度直方圖只能反映影像的灰度的范圍和分布情況,而不能反映影像像素的位置,即丟失了像素的位置資訊,一幅影像對應唯一的灰度直方圖,反之不成立,不同的影像可對應相同的直方圖;明亮影像的直方圖傾向于灰度值較大的右邊一側,暗影像的直方圖傾向于在灰度值較小的左邊一側,對比度較低的影像對應的直方圖窄而集中于灰度級的中部,對比度高的影像對應的直方圖分布范圍很寬而且分布均勻,因此,直方圖可以反映影像的清晰程度,當直方圖分布均勻時,影像最清晰,
當直方圖分布均勻時,影像最清晰
影像的特征有很多,按提取特征的范圍大小又可分為:
①點特征
僅由各個像素就能決定的性質,如單色影像中的灰度值、彩色影像中的紅?、綠(G)、藍(B)成分的值,
②區域特征
在小鄰域內所具有的性質,如線和邊緣的強度、方向、密度和統計量(平均值、方差等)等,
③區域特征
在影像內的物件物 (一般是指與該區域外部有區別的具有一定性質的區域)內的點或者區域的特征分布,或者統計量,以及區域的幾何特征(面積、形狀)等,
④整體特征
整個影像作為一個區域看待時的統計性質和結構特征等
1.特征提取
獲取影像特征資訊的操作稱作特征提取,它作為模式識別、影像理解或資訊量壓縮的基礎是很重要的,通過特征提取,可以獲得特征構成的影像(稱作特征影像)和特征引數,

2.特征空間
把從影像提取的m個特征量 𝑦 1 , 𝑦 2 , … , 𝑦 𝑚 𝑦_1 ,𝑦_2, …,𝑦_𝑚 y1?,y2?,…,ym?,用 m 維的向量 Y = [ 𝑦 1 𝑦 2 … 𝑦 𝑚 ] 𝑡 Y=[𝑦_1 𝑦_2 … 𝑦_𝑚]^𝑡 Y=[y1?y2?…ym?]t 表示稱為特征向量,另外,對應于各特征量的m維空間叫做特征空間,

(二) 影像噪聲
1. 噪聲種類
①外部噪聲,如天體放電干擾、電磁波從電源線竄入系統等產生的噪聲,
②內部噪聲,系統內部產生,主要包括四種:由光和電的基本性質引起的、機械運動產生的噪聲、元器件噪聲、系統內部電路噪聲,
2. 噪聲特征
對灰度影像 f ( x , y ) f(x,y) f(x,y) 來說,可看做二維亮度分布,則噪聲可看做對亮度的干擾,用 n ( x , y ) n(x,y) n(x,y) 表示,常用統計特征來描述噪聲,如均值、方差(交流功率)、總功率等,
3. 噪聲的模型
按噪聲對影像的影響可分為加性噪聲模型和乘性噪聲模型兩大類,設 f ( x , y ) f(x,y) f(x,y) 為理想影像, n ( x , y ) n(x,y) n(x,y) 為噪聲, 實際輸出影像為 g ( x , y ) g(x,y) g(x,y),
① 加性噪聲,與影像光強大小無關
g
(
x
,
y
)
=
f
(
x
,
y
)
+
n
(
x
,
y
)
g(x,y)= f(x,y)+ n(x,y)
g(x,y)=f(x,y)+n(x,y)
② 乘性噪聲,與影像光強大小相關,隨亮度大小變化而變化,
g
(
x
,
y
)
=
f
(
x
,
y
)
[
1
+
n
(
x
,
y
)
]
g(x,y)=f(x,y)[1+ n(x,y)]
g(x,y)=f(x,y)[1+n(x,y)]
4. 影像系統常見的噪聲
①光電管噪聲
②攝像管噪聲
③前置放大器噪聲
④光學噪聲
四、影像的資料結構
影像數字結構是指影像像素灰度值的存盤方式,常用方式是將影像各像素灰度值用一維或二維陣列相應的各元素加以存盤,
此外,其他方式:
1.組合方式
2.位元面方式
3.分層結構
4.樹結構
5.多重影像資料存盤
1. 組合方式
方法:一個字長存放多個像素灰度值,
特點:節省記憶體,但計算量增加,處理程式復雜

2. 位元面方式
將所有像素灰度的相同位元位用一個二維陣串列示,形成位元面,n 個位元位表示的灰度影像按位元面方式存取,就得到 n 個位元面,
特點:能充分利用記憶體空間,便于進行位元面之間的運算,但對灰度影像處理耗時多,

3.分層結構
錐形結構:對 2 k × 2 k 2^k×2^k 2k×2k 個像素形成的影像,依次構成解析度下降的 k + 1 k+1 k+1 幅影像的層次集合,
方法:從原影像 I 0 I_0 I0? 開始,依次產生行列像素數都變為1/2的一幅幅的影像 I 1 , I 2 , . . . , I k I_1, I_2, ..., I_k I1?,I2?,...,Ik?,此時,作為影像 I i I_i Ii? 的各像素的值,就是它前一個影像 I ( i ? 1 ) I_(i-1) I(?i?1)的相應的 2×2 像素的灰度的平均值,
優點:先對低解析度影像進行處理,然后根據需要對高解析度影像進行處理,可提高效率

4. 樹結構
對于如圖所示的一幅二值影像的行、列接連不斷地二等分,如果影像被分割部分中的全體像素都變成具有相同的特征時,這一部分則不再分割,
用這種方法,可以把影像用樹結構(4叉樹)表示,這可以用在特征提取和資訊壓縮等方面

5.多重影像資料存盤
對于彩色影像或多波段影像而言,每個像素包含著多個波段的資訊,
存盤方式有三種:
(1)逐波段存盤,分波段處理時采用,
(2)逐行存盤,逐行掃描記錄設備采用,
(3)逐像素存盤,用于分類

五、影像檔案格式
按不同的方式進行組織或存盤數字影像像素的灰度,就得到不同格式的影像檔案,影像檔案按其格式的不同具有相應的擴展名,常見的影像檔案格式按擴展名分為:RAW格式、BMP格式、TGA格式、PCX格式、GIF格式、TIFF格式等,這些影像格式都大致包含下列特征:
(1)描述影像的高度、寬度以及各種物理特征的資料,
(2)彩色定義
(3)描述影像的位圖資料體
下面只對BMP格式作較詳細介紹,其他格式只做簡介
1.RAW格式
它是將像素按行列號順序存盤在檔案中,這種文
件只含有影像像素資料,不含有資訊頭,因此,
在讀影像時,需要事先知道影像大小(矩陣大
小),它是最簡單的一種影像檔案格式,
2.BMP格式
由以下四個部分組成
1)14位元組的檔案頭;
2)40位元組的資訊頭;
3)8位元組的顏色定義;
4)位圖資料
1)位圖檔案頭BITMAPFILEHEADER
它的結構如下:
typedef struct tagBITMAPFILEHEADER{
WORD bfType; /*指定檔案型別,必須是0x424D,即字串“BM” */
DWORD bfSize; /*指定檔案大小 */
WORD bfReserved1;為/*保留字 */
WORD bfReserved2; /*保留字 */
DWORD bfOffBits;為/*檔案頭到實際的位圖資料的偏移位元組數 * /
}BITMAPFILEHEADER, FAR *LPBITMAPFILEHEADER;
該結構的長度是固定的,為14個位元組 ,
2)位圖資訊頭BITMAPINFOHEADER
結構的長度為40個節 , 其結構如下:
typedef struct tagBITMAPINFOHEADER{
DWORD bfSize; /* 指定這個結構的大小,為40個位元組
LONG biWidth; /*指定影像的寬度,單位是像素
LONG biHeight; /*指定影像的高度,單位是像素;
WORD biPlanes; /*必須是1
WORD biBitCount; /*指定表示顏色位數,1(黑白)8(256色)、24(真彩色)
DWORD biCompression; /*指定是否壓縮,分別為BI_RGB、BI_RLE4、BI_RLE8
DWORD biSizeImage; /*指定實際的位圖資料占用的位元組數,
LONG biXPelsPerMeter; /*指定目標設備的水平解析度
LONG biYPersPerMeter; /*指定目標設備的垂直解析度
DWORD biClrUsed; /*指定本影像實際用到的顏色數
DWORD biClrImportant; /*指定本影像中重要的顏色數
}BITMAPINFOHEADER, FAR *LPBITMAPINFOHEADER;
3)palette(調色板)
調色板實際上是一個陣列 ,陣列中每個元素的型別為一個
RGBQUAD結構,占4個位元組,結構定義如下:
typedef struct tagRGBQUAD{
BYTE rgbBlue;
BYTE rgbGreen;
BYTE rgbRed;
BYTE rgbReserved;
}RGBQUAD;
有些位圖,比如真彩色圖,沒有調色板,他們的位圖資訊頭
后直接是位圖資料,
4)位圖資料
它分兩種情況:對于用到調色板的位圖,影像資料就是該像
素顏色在調色板中的索引值;對于真彩色圖,影像資料就是實
際的R、G、B值,
a)位圖是1,4,8位時,有調色板,

-
對于2色位圖,用1位就可以表示該像素的顏色,因此一個位元組可以表示8個像素;
-
對于16色位圖,用4位可以表示一個像素的顏色,所以1個位元組可以表示2個像素;
-
對于256色位圖,一個位元組剛好表示一個像素;
b) 位圖是24位(真彩色)時,無調色板,

對于真彩色圖,3個位元組才能表示1個像素,
3.GIF
GIF影像是基于顏色串列的,最多支持8位,GIF
支持在一幅GIF檔案中存放多幅彩色影像,并且
可以按照一定的順序和時間間隔將多幅影像依次
讀出并顯示在螢屏上,這樣就可以形成一種簡單
的影片效果,
GIF一般有七個資料區組成:頭檔案、通用調色
板、位圖資料區以及四個擴充區,
4.TIFF檔案
TIFF影像檔案主要由三部分組成:檔案頭、標識
資訊區和影像資料區
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/401509.html
標籤:其他
