摘要：本文詳細介紹基于支持向量機的影像分類系統，給出MATLAB的演算法介紹及界面設計程序，在界面中可點擊選擇圖片或帶圖片的檔案夾，系統自動對所涉及圖片進行識別分類，可選擇自己訓練的模型進行分類；另外系統設計了模型訓練功能，可在界面上選擇訓練資料集的檔案夾和少量選擇設定，系統便可以自動進行模型訓練，適合不同的自定義資料集；演算法部分的特征提取程序采用方向梯度直方圖（HOG）特征，分類程序采用性能優異的核支持向量機（SVM）演算法，系統界面清新美觀，文中包含完整的代碼檔案及資料集，開箱即用，適合新手朋友學習參考，

前言
1. 效果演示
2. Caltech 101資料集
3. HOG特征提取
4. 訓練和評估模型
5. 測驗模型
下載鏈接
結束語

?點擊跳轉至文末所有涉及的完整代碼檔案下載頁?

完整資源下載鏈接：https://mianbaoduo.com/o/bread/mbd-YpiTl5ht

代碼介紹及演示視頻鏈接：https://www.bilibili.com/video/BV1V44y1M7mC/（正在更新中，歡迎關注博主B站視頻）

前言

當前機器學習的演算法已經獲得應用，對于經典的支持向量機（SVM）演算法，其有著實作簡單、解釋性較強、性能優越的特點，如今支持向量機的研究力度并沒有減退，選擇何種演算法應該取決于具體的機器學習任務，對于多類別的影像分類任務，支持向量機或許是一個不錯的選擇，本文介紹的代碼可以實作較高的分類測驗準確率，所以想借此為大家提供一個學習的Demo共同交流，

思路是先基于核支持向量機（SVM）演算法開發一個能夠根據圖片內容進行分類的腳本，所用到的資料集可以是當前公開的分類圖片資料集，也可以是自行從網路上爬取的，除了演算法實作，為了便于展示和訓練，我們利用MATLAB的APP設計工具開發一個GUI系統界面，能夠滿足我們選擇模型、圖片、檔案夾路徑的需求，初始界面如上圖所示，另外由于自行設定的資料集可能經常調整，所以相應的代碼也需要調整，所以這里把資料集的調整考慮進去，設計了可選擇訓練資料集、設定訓練引數的功能，其界面如下圖所示，

本文給出了MATLAB實作的完整代碼供大家參考，有基礎的讀者可按照文中的介紹復現出完整程式；對于想獲取全部資料集及程式檔案的朋友，可以點擊提供的下載鏈接獲取可直接運行的代碼，原創不易，還請多多支持了，如本文對您有所幫助，敬請點贊、收藏、關注！

1. 效果演示

（一）選擇模型+選擇圖片+歷史記錄

首先還是用動圖先展示一下效果，進入軟體界面后，點擊模型選擇按鈕即可彈出檔案選擇視窗，可選擇自行訓練的模型檔案；然后同樣點擊圖片選擇按鈕，可以選擇一張需要測驗的圖片，點擊確認后，模型則自動識別圖片內容，并給出預測的結果；結果會被記錄在右側的表格中，可供再次查看確認，本功能的界面展示如下圖所示：

（二）批量圖片識別+分類結果展示

對于需要批量識別的情況，可選擇界面中的檔案夾按鈕，選擇一個待測驗的圖片檔案夾，系統自動識別檔案夾下的檔案并進行分類識別，在此程序中識別結果展示在右側，包括分類結果、準確率、圖片的歷史記錄，用戶可點擊右側的結果記錄表格中的對應序號，回看圖片以及對應的識別結果，該部分演示如下圖所示：

（三）自定義模型訓練+引數設定+自動訓練

如果想更換資料集并重新訓練模型，這時只需要點擊“訓練”選項卡，可切換至訓練界面，如下圖所示，可選擇一個自定義的圖片檔案夾，該檔案夾下包含多個以類別命名的子檔案夾，系統自動將檔案夾的名字作為每一類的標簽，并將讀取的結果顯示在界面中，可以選擇訓練占比和核函式的訓練設定，點擊“開始訓練”即可自動進行訓練，訓練的程序資訊顯示在界面上，最終可以得到訓練測驗集準確率，以及各類別的混淆矩陣結果，模型自動保存在當前檔案夾下供后續選擇，

2. Caltech 101資料集

提到分類任務的資料集很容易想到ImageNet，它無疑是個巨大的訓練圖庫，對于我們自行訓練和測驗其實是非常費力的事情（除非你擁有高端設備），所以我并不推薦在學習階段就使用，至于早前不少論文中廣泛使用的CIFAR10 / CIFAR100以及MNIST資料集，它們的尺寸過小，且本身任務比較簡單，目前已不在普遍使用（水論文除外），所以這里我們選擇的資料集是更貼近真實情況的Caltech 101資料集，也是當前非常流行的資料集，

Caltech-101 Dataset是由 101 個類別的物件圖片組成的資料集，它主要用于目標識別和影像分類，官網地址為https://www.vision.caltech.edu/Image_Datasets/Caltech101/，該資料集不同類別有 40 至 800 張圖片，每張圖片的大小在 300 * 200 像素，且資料集的發布者均已標注對應的目標以供使用，該資料集由加州理工學院的李菲菲、馬克安德烈托和 Marc’Aurelio Ranzato 于 2003 年 9 月收集，相關論文有《Learning generative visual models from few training examples: an incremental Bayesian approach tested on 101 object categories》、《One-Shot learning of object categories》等，

下載完成后的資料集檔案如上圖所示，解壓后即可看到其中包含101個子檔案夾，每個檔案夾對應一個類別的圖片，檔案夾的名字表示對應的標簽，由于該資料集檔案數目較大，這里選取其中的10類如下圖所示，將這幾個檔案夾復制到新建的檔案夾進行實驗，最終確定所用的資料集，

資料集準備完畢，現在可以通過檔案夾讀取圖片了，在MATLAB中可使用imageDatastore函式方便地批量讀取圖片集，它通過遞回掃描檔案夾目錄，將每個檔案夾名稱自動作為影像的標簽，該部分代碼如下：

clear
clc
rng default  % 保證結果運行一致

mpath = matlab.desktop.editor.getActiveFilename; % 程式所在目錄
[pathstr,~]=fileparts(mpath);
cd(pathstr); % 自動切換至程式所在目錄

imgDir = fullfile("../10_ObjectCategories/");
% imageDatastore遞回掃描目錄，將每個檔案夾名稱自動作為影像的標簽
dataSet = imageDatastore(imgDir, 'IncludeSubfolders', true, 'LabelSource', 'foldernames');

至此讀取到的資料集被存放在dataSet變數中，可以簡單查看訓練和測驗集每類標簽的樣本個數，顯示代碼如下：

trainSetDetail = countEachLabel(dataSet) % 訓練資料

執行以上代碼運行結果如下：

這里展示一下讀取到的圖片，代碼如下所示：

figure
imshow(dataSet.Files{520});

執行該代碼可以看到如下的運行結果：

這里我們劃分訓練和測驗資料集，使用留一法將80%的資料用于訓練，剩余的資料用于模型測驗，將訓練和測驗檔案保存在trainSet.Files及testSet.Files變數中，對應的標簽則存在Label中，該部分代碼如下：

indices = crossvalind('Kfold',dataSet.Labels,5); % 進行交叉驗證劃分
t=1;

test=(indices == t);
train=~test;
% 訓練資料集
trainSet.Files = dataSet.Files(train);
trainSet.Labels = dataSet.Labels(train);
% 測驗資料集
testSet.Files = dataSet.Files(test);
testSet.Labels = dataSet.Labels(test);

至此完成資料集的讀取和劃分作業，接下來進行特征提取步驟，

3. HOG特征提取

真正用于訓練分類器的資料并不是原始圖片資料，而是先經過特征提取后得到的特征向量，這里使用的特征型別是HOG，也就是方向梯度直方圖，所以這里重要的一點是正確提取出HOG特征，extractHOGFeatures是MATLAB自帶的HOG特征提取函式，該函式不僅可以有效提取特征，還可以回傳特征的可視化結果以方便展示，該部分代碼如下：

cellSize = [4 4];

img = readimage(dataSet, 23);
img = rgb2gray(img);   % 灰度化圖片
img = imbinarize(img);
img = imresize(img, [100 100]);
[hog_4x4, vis4x4] = extractHOGFeatures(img,'CellSize',[4 4]);

hogFeatureSize = length(hog_4x4);

% 提取HOG特征
tStart = tic;

[trainFeatures, trainLabels] = extractHogFromImageSet(trainSet, hogFeatureSize, cellSize); % 訓練集特征提取
[testFeatures, testLabels] = extractHogFromImageSet(testSet, hogFeatureSize, cellSize);    % 測驗集特征提取

tEnd = toc(tStart);
fprintf('提取特征所用時間：%.2f秒\n', tEnd);

以上代碼首先進行圖片灰度化、二值化、尺寸調整等預處理操作，然后呼叫extractHogFromImageSet函式提取訓練和測驗集的HOG特征，由于圖片數量眾多，提取特征程序尚需一定時間，這里對訓練集、測驗集提取程序進行計時，因計算機算力不同，執行時間可能會不一致，最終列印特征提取所用的時間，

提取特征所用的時間：18.73秒

4. 訓練和評估模型

下面我們使用以上提取的HOG特征構建支持向量機模型，利用提取的訓練集特征進行訓練，首先利用templateSVM函式構建支持向量機模板引數，選擇gaussian核函式，執行標準化處理資料，顯示訓練程序；利用fitcecoc函式執行訓練程序，其代碼如下，

% 訓練支持向量機
t = templateSVM('SaveSupportVectors',true, 'Standardize', true, 'KernelFunction','gaussian', ...
    'KernelScale', 'auto','Verbose', 0);      % 利用polynomial核函式, 標準化處理資料，顯示訓練程序（verbose取0時取消顯示）

tStart = tic; % 計時開始
classifier = fitcecoc(trainFeatures, trainLabels, 'Learner', t); % 訓練SVM模型
tEnd = toc(tStart);
fprintf('訓練模型所用時間：%.2f秒\n', tEnd);

等待訓練完成，我們可以使用訓練好的分類器進行預測，這里先利用測驗集評估模型并計算分類評價指標，對測驗集進行預測的代碼如下：

tStart = tic;
% 對測驗資料集進行預測
predictedLabels = predict(classifier, testFeatures);
tEnd = toc(tStart);
fprintf('模型對測驗集進行預測所用時間：%.2f秒\n', tEnd);

運行結果如下：

模型對測驗集進行預測所用時間：5.75秒

得到了預測結果，可以使用混淆矩陣評估結果，以下代碼首先計算混淆矩陣結果，然后將結果列印出來：

分類準確率可以通過以下代碼進行計算：

accuracy = sum(predictedLabels == testLabels) / numel(testLabels);
fprintf('模型在測驗集上的準確率：%.0f%%\n', accuracy*100);

以上代碼顯示了混淆矩陣的結果，但可能還不夠直觀，下面繪制混淆矩陣圖幫助更好了解模型性能：

% 繪制混淆矩陣圖
plotconfusion(testLabels, predictedLabels);

運行代碼后顯示混淆矩陣圖如下圖所示，每行對角線上的網格（綠色網格）處顯示了某類樣本預測正確的數目及其占比，右下角網格表示分類的準確率，可以看出該分類器具有90.2%的總體分類準確率，

為了便于后續測驗，這里保存模型檔案，其代碼如下：

save('trainedSvmModel.mat','classifier');

5. 測驗模型

這里我們選取幾張圖片進行測驗，以便對模型的效果有個更直觀的感受，這部分代碼如下所示：

clear
clc
rng default  % 保證結果運行一致
img_test_1 = imread("../10_ObjectCategories/airplanes/image_0137.jpg");
img_test_2 = imread("../10_ObjectCategories/dragonfly/image_0001.jpg");
img_test_3 = imread("../10_ObjectCategories/inline_skate/image_0003.jpg");
img_test_4 = imread("../10_ObjectCategories/ketch/image_0005.jpg");
img_test_5 = imread("../10_ObjectCategories/Motorbikes/image_0006.jpg");
img_test_6 = imread("../10_ObjectCategories/umbrella/image_0010.jpg");

讀取圖片后，首先利用imshow函式將幾張圖片顯示出來，采用subplot函式劃分圖片坐標軸區域，以便將6張圖片展示出來：

figure;
subplot(2, 3, 1); imshow(img_test_1);
subplot(2, 3, 2); imshow(img_test_2);
subplot(2, 3, 3); imshow(img_test_3);
subplot(2, 3, 4); imshow(img_test_4);
subplot(2, 3, 5); imshow(img_test_5);
subplot(2, 3, 6); imshow(img_test_6);

執行以上代碼，運行結果如下圖所示：

與上一章類似，首先提取HOG特征，這里將提取到的特征進行可視化展示，并將其與原始圖片進行對比，其代碼如下：

img = rgb2gray(img_test_1);
img = imbinarize(img);
% img = imresize(img, [100 100]);
[hog_1, vis_1] = extractHOGFeatures(img,'CellSize',[4 4]);
figure
subplot(2,1,1);
imshow(img_test_1)
title("原始影像")
subplot(2, 1, 2)
plot(vis_1);
title("特征影像")

運行以上代碼，特征提取的影像運行結果如下圖所示：

接下來我們載入前面訓練好的模型，對讀取到的圖片進行預測并顯示結果，值得注意的是，每張圖片在預測前的預處理作業，這里通過代碼將灰度化、二值化、HOG特征的結果可視化在同一個繪圖視窗中，其代碼如下：

load("trainedSvmModel.mat", "classifier");
img_gray = rgb2gray(img_test_4);
img_bin = imbinarize(img_gray);
img = imresize(img_bin, [100 100]);
[hog_4, vis_4]  = extractHOGFeatures(img,'CellSize',[4 4]);

% 對測驗資料集進行預測
fea_4 = extractHOGFeatures(img,'CellSize',[4 4]);
predictedLabels = predict(classifier, fea_4);
fprintf("預測結果：%s",predictedLabels);

figure
subplot(2,2,1)
imshow(img_test_4);
title(["預測結果：", char(predictedLabels)])
subplot(2,2,2)
imshow(img_gray);

subplot(2,2,3)
imshow(img_bin);
subplot(2,2,4)
plot(vis_4)

運行以上代碼，顯示結果如下：

下載鏈接

若您想獲得博文中涉及的實作完整全部程式檔案（包括資料集，m, UI檔案等，如下圖），這里已打包上傳至博主的面包多平臺和CSDN下載資源，本資源已上傳至面包多網站和CSDN下載資源頻道，可以點擊以下鏈接獲取，已將所有涉及的檔案同時打包到里面，點擊即可運行，完整檔案截圖如下：

在檔案夾下的資源顯示如下：

注意：本資源已經過除錯通過，下載后可通過MATLAB R2021b運行；訓練主程式為main_trainClassifier.mlx，測驗程式可運行main_testClassifier.mlx，要使用GUI界面請運行picClassifier.mlapp檔案；其它程式檔案大部分為函式而非可直接運行的腳本，使用時請勿直接點擊運行！???

完整資源下載鏈接1：博主在面包多網站上的完整資源下載頁

完整資源下載鏈接2：https://mianbaoduo.com/o/bread/mbd-YpiTl5ht

注：以上兩個鏈接為面包多平臺下載鏈接，CSDN下載資源頻道下載鏈接稍后上傳，

結束語

由于博主能力有限，博文中提及的方法即使經過試驗，也難免會有疏漏之處，希望您能熱心指出其中的錯誤，以便下次修改時能以一個更完美更嚴謹的樣子，呈現在大家面前，

用心整理知識，只出精品博文

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/458552.html

標籤：其他

上一篇：虎牙實時計算平臺服務的SLA之路

下一篇：人臉表情識別系統介紹——上篇（python實作，含UI界面及完整代碼）

基于支持向量機的影像分類系統（MATLAB GUI界面版）