Python人臉識別-有解無憂

Python人臉識別

- OpenCV 簡介
- 安裝 OpenCV 模塊
- OpenCV 基本使用
- 人臉檢測
- 使用 OpenCV 進行人臉檢測
- 人臉識別
- 后序

OpenCV 簡介

OpenCV 的全稱是 Open Source Computer Vision Library，是一個跨平臺的計算機視覺庫， OpenCV 是由英特爾公司發起并參與開發，以 BSD 許可證授權發行，可以在商業和研究領域中免費使用，OpenCV 可用于開發實時的影像處理、計算機視覺以及模式識別程式，該程式庫也可以使用英特爾公司的 IPP 進行加速處理， OpenCV 用 C++語言撰寫，它的主要介面也是 C++語言，但是依然保留了大量的 C 語言介面，該庫也有大量的 Python、Java and MATLAB/OCTAVE（版本 2.5）的介面，這些語言的 API 介面函式可以通過在線檔案獲得，如今也提供對于 C#、Ch、Ruby、GO 的支持，

安裝 OpenCV 模塊

OpenCV 已經支持 python 的模塊了，直接使用 pip 就可以進行安裝，命令如下：

pip install opencv-python

若下載緩慢可以通過第三方下載

pip install -i https://mirrors.aliyun.com/pypi/simple 模塊名

若安裝失敗，可能需要更新pip

python -m pip install --upgrade pip

OpenCV 基本使用

讀取圖片
顯示影像是 OpenCV 最基本的操作之一，imshow()函式可以實作該操作，如果使用過其他 GUI 框架背景，就會很自然第呼叫 imshow()來顯示一幅影像，imshow()函式有兩個引數：顯示影像的幀名稱以及要顯示的影像本身，直接呼叫 imshow()函式影像確實會顯示，但隨即會消失，要保證圖片一直在視窗上顯示，要通過 waitKey()函式，waitKey()函式的引數為等待鍵盤觸發的時間，單位為毫秒，其回傳值是-1（表示沒有鍵被按下）

import cv2 as cv 
img=cv.imread('lena.jpg')  # 注意讀取圖片的路徑不能有中文，不然資料讀取不出來 
cv.imshow('input image',img) 
cv.waitKey(0)  # 等待鍵盤的輸入 單位是毫秒 傳入 0 無限等待 
cv.destroyAllWindows()  # C++語言 使用完記憶體必須釋放

圖片灰度轉換
OpenCV 中有數百種關于在不同色彩空間之間轉換的方法，當前，在計算機視覺中有三種常用的色彩空間：灰度、BGR、以及 HSV（Hue，Saturation，Value），
（1）灰度色彩空間是通過去除彩色資訊來將其轉換成灰階，灰度色彩空間對中間處理特別有效，比如人臉識別，（2）BGR 及藍、綠、紅色彩空間，每一個像素點都由一個三元陣列來表示，分別代表藍、綠、紅三種顏色，網頁開發者可能熟悉另一個與之相似的顏色空間：RGB 它們只是顏色順序上不同，（3）HSV，H（Hue）是色調，S（Saturation）是飽和度，V（Value）表示黑暗的程度（或光譜另一端的明亮程度），灰度轉換的作用就是：轉換成灰度的圖片的計算強度得以降低，示例如下：

# 將圖片灰度轉換
import cv2 as cv

# 讀取圖片
img = cv.imread('0.jpg')
# 顯示圖片
cv.imshow('BGR_img', img)

# 將圖片進行灰度轉換
gray_img = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
cv.imshow('gray_img', gray_img)

# 保存圖片
cv.imwrite('gray_1.jpg', gray_img)

# 等待鍵盤輸入，解決一閃而過 單位毫秒 傳入0則是無限等待
cv.waitKey(0)

# 釋放記憶體，由于OpenCv底層是C++寫的
cv.destroyAllWindows()

修改圖片尺寸
使用 cv.resize()方法,第一個引數是要修改的圖片物件，第二個引數是 dsize= 傳入一個元組，表示圖片的(寬度,高度)

# 修改圖片大小，用一個變數接收，可以保存或顯示
resize_img = cv.resize(img, dsize=(600, 500))

附：設定當鍵盤輸入指定字符后關閉圖片

# 等待鍵盤輸入，使圖片持續顯示
# cv.waitKey(0)
# 只有輸入q時候才退出
while True:
    if ord('q') == cv.waitKey(0):  # 回傳從鍵盤輸入的鍵的ascii碼值
        break

畫圖（繪制矩形&圓）
OpenCV 的強大之處的一個體現就是其可以對圖片進行任意編輯，處理，下面的這個函式最后一個引數指定的就是畫筆的大小，

import cv2 as cv

# 加載圖片
img = cv.imread('0.jpg')

# 左上角的坐標是(x,y) 矩形的寬度和高度(w,h)
x, y, w, h = 100, 100, 100, 100
cv. rectangle(img, (x, y, x+w, y+w), color=(0, 255, 255), thickness=2)  # 三個色彩的通道, thickness:線條寬度, 繪制矩形傳參是兩個點
# 繪制圓center元組指原點的坐標
# x, y, r = 200, 200, 100  # x,y原點坐標 r是半徑
# cv.circle(img, center=(x, y), radius=r, color=(0, 0, 255))

# 顯示圖片
cv.imshow('rectangle_img', img)
# 輸入鍵盤內容，關閉圖片
cv.waitKey(0)

# 關閉內容
cv.destroyAllWindows()

人臉檢測

Haar 級聯的概念
?攝影作品可能包含很多令人愉悅的細節，但是，由于燈光、視角、視距、攝像頭抖動以及數字噪聲的變化，影像細節變得不穩定，人們在分類時不會受這些物理細節方面差異的影響，以前學過，在顯微鏡下沒有兩片看起來很像的雪花，幸運的是，作者生長在加拿大，已經學會如何不用顯微鏡來識別雪花，
?因此，提取出影像的細節對產生穩定分類結果和跟蹤結果很有用，這些提取的結果被稱為特征，專業的表述為：從影像資料中提取特征，雖然任意像素都可以能影響多個特征，但特征應該比像素少得多，兩個影像的相似程度可以通過它們對應特征的歐氏距離來度量，
??Haar 特征是一種用于實作實時人臉跟蹤的特征，每一個 Haar 特征都描述了相鄰影像區域的對比模式，例如，邊、頂點和細線都能生成具有判別性的特征，
獲取 Haar 級聯資料
?1.首先我們要進入 OpenCV 官網：https://opencv.org 下載你需要的版本，點擊 RELEASES （發布），
?2.由于 OpenCV 支持好多平臺，比如 Windows, Android, Maemo, FreeBSD, OpenBSD, iOS, Linux 和 Mac OS，一般初學者都是用 windows，點擊 Windows，
?3.點擊 Windows 后跳出新界面，等待 5s 自動下載
?4.然后雙擊下載的檔案，進行安裝，實質就是解壓一下，解壓完出來一個檔案夾，其他什么也沒發生，安裝完后的目錄結構如下，其中 build 是 OpenCV 使用時要用到的一些庫檔案，而 sources 中則是 OpenCV 官方為我們提供的一些 demo 示例原始碼
?5.在 sources 的一個檔案夾 data/haarcascades，該檔案夾包含了所有 OpenCV 的人臉檢測的 XML 檔案，這些可用于檢測靜止影像、視頻和攝像頭所得到影像中的人臉，
?6,
人臉檢測器（默認）：haarcascade_frontalface_default.xml
人臉檢測器（快速 Harr）：haarcascade_frontalface_alt2.xml
人臉檢測器（側視）：haarcascade_profileface.xml
眼部檢測器（左眼）：haarcascade_lefteye_2splits.xml
眼部檢測器（右眼）：haarcascade_righteye_2splits.xml
嘴部檢測器：haarcascade_mcs_mouth.xml
鼻子檢測器：haarcascade_mcs_nose.xml
身體檢測器：haarcascade_fullbody.xml
人臉檢測器（快速 LBP）：lbpcascade_frontalface.xml

使用 OpenCV 進行人臉檢測

靜態影像中人臉檢測
?人臉檢測首先是加載影像并檢測人臉，這也是最基本的一步，為了使所得到的結果有意義，可在原始影像的人臉周圍繪制矩形框
示例：

# 人臉檢測
import cv2 as cv

def face_detect():
    # 將圖片灰度處理，降低色彩的通道
    gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
    # 加載特征資料
    face_detector = cv.CascadeClassifier('D:/Python/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml')
    face = face_detector.detectMultiScale(gray)

    for x, y, w, h in face:  # 坐標及寬度高度
        cv.rectangle(img, (x, y), (x+w, y+h), color=(0, 255, 0), thickness=2)  # img所畫圖片，坐標，顏色，寬度
    # 顯示
    cv.imshow('result', img)


# 加載圖片
img = cv.imread('lena.jpg')

# 人臉檢測
face_detect()

cv.waitKey(0)

cv.destroyAllWindows()

當圖片中人數較多時，識別需要指定引數，限定識別范圍引數： scaleFactor(比例因子)：圖片縮放多少，minNeighbors:至少檢測多少次，minSize maxSize:當前檢測區域的最大最小面積，

# 將照片灰度
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 加載特征資料
face_detector = cv.CascadeClassifier('D:/Python/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml')
# 引數： scaleFactor(比例因子)：圖片縮放多少，minNeighbors:至少檢測多少次，minSize maxSize:當前檢測區域的最大最小面積
faces = face_detector.detectMultiScale(gray)  # , scaleFactor=1.01, minNeighbors=3, maxSize=(33, 33), minSize=(28, 28)

視頻中的人臉檢測
視頻是一張一張圖片組成的，在視頻的幀上重復這個程序就能完成視頻中的人臉檢測，

import cv2 as cv

# 檢測圖片
def face_detect(img):
    # 灰度處理
    gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
    # 加載特征資料
    face_detector = cv.CascadeClassifier('D:/Python/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml')
    # 引數： scaleFactor(比例因子)：圖片縮放多少，minNeighbors:至少檢測多少次，minSize maxSize:當前檢測區域的最大最小面積
    faces = face_detector.detectMultiScale(gray)  # scaleFactor=1.01, minNeighbors=3, maxSize=(33, 33), minSize=(28, 28)

    # 遍歷檢測到的區域
    for x, y, w, h in faces:
        cv.rectangle(img, (x, y), (x+w, y+h), color=(0, 0, 255), thickness=2)
        cv.circle(img, center=(x+w//2, y+h//2), radius=w//2, color=(0, 255, 0), thickness=2)

    # 顯示圖片
    cv.imshow('result', img)

# 讀取視頻
cap = cv.VideoCapture('video.mp4')

# 視頻是重復播放，用回圈來接收
while True:
    flag, frame = cap.read()
    print('flag', flag, 'frame', frame.shape)
    # 如果視頻播放停止，則跳出回圈
    if not flag:
        break
    # 將每一張圖片傳進去進行檢測
    face_detect(frame)
    # 等待鍵盤10s若輸入q則關閉
    if ord('q') == cv.waitKey(10):
        break

cv.destroyAllWindows()
cap.release()

人臉識別

??人臉檢測是 OpenCV 的一個很不錯的功能，它是人臉識別的基礎，
? ?人臉識別其實就是一個程式能識別給定影像或視頻中的人臉，實作這一目標的方法之一是用一系列分好類的影像來“訓練”程式，并基于這些影像來進行識別，這就是OpenCV 及其人臉識別模塊進行人臉識別的程序，人臉識別模塊的另外一個重要特征是：每個識別都具有轉置信（confidence）評分，因此可在實際應用中通過對其設定閾值來進行篩選，人臉識別所需要的人臉可以通過兩種方式來得到：自己獲得影像或從人臉資料庫免費獲得可用的人臉影像，互聯網上有許多人臉資料庫：為了對這些樣本進行人臉識別，必須要在包含人臉的樣本影像上進行人臉識別，這是一個學習的程序，但并不像自己提供的影像那樣令人滿意，

訓練資料
? 有了資料，需要將這些樣本影像加載到人臉識別演算法中，所有的人臉識別演算法在它們的 train()函式中都有兩個引數：影像陣列和標簽陣列，這些標簽表示進行識別時候某人人臉的 ID，因此根據 ID 可以知道被識別的人是誰，要做到這一點，將在「trainer/」目錄中保存為.yml 檔案，
?在使用 Python 3 &OpenCV 3.0.0 進行人臉識別訓練時發現例外： AttributeError: ‘module’ object has no attribute ‘LBPHFaceRecognizer_create’OpenCV 需要安裝 opencv-contrib-python 模塊，直接使用 pip 就可以進行安裝，命令如下：

pip install opencv-contrib-python

安裝opencv-contrib-python模塊可能出現的問題：

1.下載緩慢引起超時timeout問題

pip --default-timeout=100 install -U opencv-contrib-python

2.該模塊較大官方途徑下載緩慢，推薦使用第三方通道下載

pip install -i https://mirrors.aliyun.com/pypi/simple opencv-contrib-python

示例:
需要在當前目錄下創建data和 trainer兩個檔案夾，分別存放要識別的人臉的多張.pgm照片，訓練完的資料

附：（PGM 是便攜式灰度影像格式(portable graymap file format),在黑白超聲影像系統中經常使用PGM格式的影像，檔案的后綴名為”.pgm”,PGM格式影像格式分為兩類:P2和P5型別，不管是P2還是P5型別的PGM檔案,都由兩部分組成,檔案頭部分和資料部分，）

import os
import cv2
from PIL import Image
import numpy as np

def getImageAndLabels(path):
    facesSamples = []
    ids = []
    imagePaths = [os.path.join(path, f) for f in os.listdir(path)]

    # 檢測人臉
    # 加載特征資料
    face_detector = cv2.CascadeClassifier(
        'D:/Python/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml')
    # 引數： scaleFactor(比例因子)：圖片縮放多少，minNeighbors:至少檢測多少次，minSize maxSize:當前檢測區域的最大最小面積
    # scaleFactor=1.01, minNeighbors=3, maxSize=(33, 33), minSize=(28, 28)

    # 遍歷串列中的圖片
    for imagePath in imagePaths:
        # 打開當前圖片
        PIL_img = Image.open(imagePath).convert('L')

        # 將圖片轉化為陣列
        img_numpy = np.array(PIL_img, 'uint8')
        faces = face_detector.detectMultiScale(img_numpy)

        # 獲取每張圖片的id
        id = int(os.path.split(imagePath)[1].split('.')[0])

        # 獲取人臉區域
        for x, y, w, h in faces:
            # 進行切片處理,獲取影像陣列和id
            facesSamples.append(img_numpy[y:y+h, x:x+w])
            ids.append(id)

        return facesSamples, ids


if __name__ == '__main__':
    # 圖片路徑
    path = './data/jm/'
    # 獲取影像陣列和id標簽陣列
    faces, ids = getImageAndLabels(path)

    # 獲取回圈物件
    recognizer = cv2.face.LBPHFaceRecognizer_create()
    recognizer.train(faces, np.array(ids))

    # 保存檔案
    recognizer.write('trainer/trainer.yml')

基于 LBPH 的人臉識別
?LBPH（Local Binary Pattern Histogram）將檢測到的人臉分為小單元，并將其與模型中的對應單元進行比較，對每個區域的匹配值產生一個直方圖，由于這種方法的靈活性，LBPH 是唯一允許模型樣本人臉和檢測到的人臉在形狀、大小上可以不同的人臉識別演算法，
?調整后的區域中呼叫 predict()函式，該函式回傳兩個元素的陣列：第一個元素是所識別 個體的標簽，第二個是置信度評分，所有的演算法都有一個置信度評分閾值，置信度評分用來 衡量所識別人臉與原模型的差距，0 表示完全匹配，可能有時不想保留所有的識別結果，則需要進一步處理，因此可用自己的演算法來估算識別的置信度評分，LBPH 一個好的識別參考值要低于 50 ，任何高于 80 的參考值都會被認為是低的置信度評分，

示例：

import cv2

# 加載訓練資料集檔案

# 獲取人臉識別物件
recognizer = cv2.face.LBPHFaceRecognizer_create()
# 讀取訓練資料
recognizer.read('trainer/trainer.yml')

# 準備識別圖片
img = cv2.imread('6.pgm')

# 將圖片灰度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 加載特征資料
face_detector = cv2.CascadeClassifier('D:/Python/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml')
# 引數： scaleFactor(比例因子)：圖片縮放多少，minNeighbors:至少檢測多少次，minSize maxSize:當前檢測區域的最大最小面積
faces = face_detector.detectMultiScale(gray)  # scaleFactor=1.01, minNeighbors=3, maxSize=(33, 33), minSize=(28, 28)

# 獲取臉部特征值
for x, y, w, h in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), thickness=2)
    cv2.circle(img, (x+w//2, y+h//2), radius=w//2, thickness=2, color=(0, 0, 255))

    # 人臉識別
    id, confidence = recognizer.predict(gray[y:y+h, x:x+w])
    print('標簽id:', id, '置信評分：', confidence)


# 顯示圖片
cv2.imshow('result', img)
cv2.waitKey(0)  # 一直顯示
cv2.destroyAllWindows()  # 釋放資源

后序

繼續深究人臉識別領域后，將更新文章，

感謝跟隨老師的代碼在未知領域里探索，希望我能走的更高更遠

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/262560.html

標籤：python

上一篇：Python學習筆記之六：Python中的類

下一篇：機器學習----keras 設計一個CNN卷積神經網路花卉分類器進行花卉的分類