主頁 > 後端開發 > 用Python做了個圖片識別系統(附原始碼)

用Python做了個圖片識別系統(附原始碼)

2022-06-17 14:43:20 後端開發

本專案將使用python3去識別圖片是否為色情圖片,會使用到PIL這個影像處理庫,并且撰寫演算法來劃分影像的皮膚區域

介紹一下PIL:

PIL(Python Image Library)是一種免費的影像處理工具包,這個軟體包提供了基本的影像處理功能,如:改變影像大小,旋轉

影像,影像格式轉化,色場空間轉換(這個我不太懂),影像增強(就是改善清晰度,突出影像有用資訊),直方圖處理,插值

(利用已知鄰近像素點的灰度值來產生未知像素點的灰度值)和濾波等等,雖然這個軟體包要實作復雜的影像處理演算法并不太適

合,但是python的快速開發能力以及面向物件等等諸多特點使得它非常適合用來進行原型開發,

在 PIL 中,任何一副影像都是用一個 Image 物件表示,而這個類由和它同名的模塊匯出,因此,要加載一副影像,最簡單的形式

是這樣的:
在這里插入圖片描述

import Image
img = Image.open(“dip.jpg”)

注意:第一行的 Image 是模塊名;第二行的 img 是一個 Image 物件; Image 類是在 Image 模塊中定義的,關于 Image 模

塊和 Image 類,切記不要混淆了,現在,我們就可以對 img 進行各種操作了,所有對 img 的 操作最終都會反映到到 dip.img 圖

像上

環境準備

PIL 2009 年之后就沒有更新了,也不支持 Python3 ,于是有了 Alex Clark 領導的公益專案 Pillow ,Pillow 是一個對 PIL 友好的分

支,支持 Python3,所以我們這里安裝的是 Pillow,這是它的官方檔案,

默認已經有python3.0以上和包管理工具pip3,那要執行如下命令升級pip3并安裝Pillow 工具包:

sudo install -U pip3
sudo install Pillow

 

程式原理

根據顏色(膚色)找出圖片中皮膚的區域,然后通過一些條件判斷是否為色情圖片,

程式的關鍵步驟如下:

python學習交流Q群:906715085####
1.遍歷每個像素,檢查像素顏色是否為膚色


2.將相鄰的膚色像素歸為一個皮膚區域,得到若干個皮膚區域


3.剔除像素數量極少的皮膚區域

 

我們定義非色情圖片的判定規則如下(滿足任意一個判斷為真):

1.皮膚區域的個數小于3個


2.皮膚區域的像素與影像所有像素的比值小于15%


3.最大皮膚區域小于總皮膚面積的45%


4.皮膚區域數量超過60個

 

這些規則你可以嘗試更改,直到程式效果讓自己滿意為止,關于像素膚色判定這方面,公式可以在網上找到很多,但是世界上不

可能有正確率100%的公式,你可以用自己找到的公式,在程式完成后慢慢除錯,

在這里插入圖片描述

?RGB顏色模式

第一種:==r > 95 and g > 40 and g < 100 and b > 20 and max([r, g, b]) - min([r, g, b]) > 15 and abs(r - g) > 15 and r > g and r > b==

第二種:==nr = r / (r + g + b), ng = g / (r + g + b), nb = b / (r +g + b) ,nr / ng > 1.185 and r * b / (r + g + b) ** 2 > 0.107 and r * g / (r + g + b) ** 2 > 0.112==
?HSV顏色模式

==h > 0 and h < 35 and s > 0.23 and s < 0.68==



?YCbCr顏色模式

==97.5 <= cb <= 142.5 and 134 <= cr <= 176==

 

一幅影像有零個到多個的皮膚區域,程式按發現順序給它們編號,第一個發現的區域編號為0,第n個發現的區域編號為n-1

用一種型別來表示像素,我們給這個型別取名為Skin,包含了像素的一些資訊:唯一的編號id、是/否膚色skin、皮膚區域號

region、橫坐標x、縱坐標y

遍歷所有像素時,我們為每個像素創建一個與之對應的Skin物件,并設定物件的所有屬性,其中region屬性即為像素所在的皮膚

區域編號,創建物件時初始化為無意義的None,關于每個像素的id值,左上角為原點,像素id值按照像素坐標排布,那么看起來

如下圖:
在這里插入圖片描述

其實id的順序也即遍歷的順序,遍歷所有像素時,創建Skin物件后,如果當前像素為膚色,且相鄰的像素有膚色的,那么我們把

這些膚色像素歸到一個皮膚區域,

相鄰像素的定義:通常都能想到是當前像素周圍的8個像素,然而實際上只需要定義4個就可以了,位置分別在當前像素的左方,

左上方,正上方,右上方,因為另外四個像素都在當前像素后面,我們還未給這4個像素創建對應的Skin物件:

在這里插入圖片描述

在這里插入圖片描述

實作腳本

直接在python中新建nude.py檔案,在這個檔案進行代碼撰寫:

匯入所需要的模塊:

import sys
import os
import _io
from collections import namedtuple
from PIL import Image

 

我們將設計一個Nude類:

class Nude:

 

這個類里面我們首先使用 collections.namedtuple() 定義一個 Skin 型別:

Skin = namedtuple("Skin", "id skin region x y")

 

collections.namedtuple() 函式實際上是一個回傳 Python 中標準元組型別子類的一個工廠方法,你需要傳遞一個型別名和你需要

的欄位給它,然后它就會回傳一個類,你可以初始化這個類,為你定義的欄位傳遞值等,詳情參見官方檔案,

然后定義 Nude 類的初始化方法:

python學習交流Q群:906715085###
def __init__(self, path_or_image):
    # 若 path_or_image 為 Image.Image 型別的實體,直接賦值
    if isinstance(path_or_image, Image.Image):
        self.image = path_or_image
    # 若 path_or_image 為 str 型別的實體,打開圖片
    elif isinstance(path_or_image, str):
        self.image = Image.open(path_or_image)

 

在這里插入圖片描述

# 獲得圖片所有顏色通道
bands = self.image.getbands()
# 判斷是否為單通道圖片(也即灰度圖),是則將灰度圖轉換為 RGB 圖
if len(bands) == 1:
    # 新建相同大小的 RGB 影像
    new_img = Image.new("RGB", self.image.size)
    # 拷貝灰度圖 self.image 到 RGB圖 new_img.paste (PIL 自動進行顏色通道轉換)
    new_img.paste(self.image)
    f = self.image.filename
    # 替換 self.image
    self.image = new_img
    self.image.filename = f
# 存盤對應影像所有像素的全部 Skin 物件
self.skin_map = []
# 檢測到的皮膚區域,元素的索引即為皮膚區域號,元素都是包含一些 Skin 物件的串列
self.detected_regions = []
# 元素都是包含一些 int 物件(區域號)的串列
# 這些元素中的區域號代表的區域都是待合并的區域
self.merge_regions = []
# 整合后的皮膚區域,元素的索引即為皮膚區域號,元素都是包含一些 Skin 物件的串列
self.skin_regions = []
# 最近合并的兩個皮膚區域的區域號,初始化為 -1
self.last_from, self.last_to = -1, -1
# 色情影像判斷結果
self.result = None
# 處理得到的資訊
self.message = None
# 影像寬高
self.width, self.height = self.image.size
# 影像總像素
self.total_pixels = self.width * self.height

 

在這里插入圖片描述

isinstane(object, classinfo) 如果引數 object 是引數 classinfo 的實體,回傳真,否則假;引數 classinfo 可以是一個包含若干 type

物件的元組,如果引數 object 是其中任意一個型別的實體,回傳真,否則假,

涉及到效率問題,越大的圖片所需要消耗的資源與時間越大,因此有時候可能需要對圖片進行縮小,所以需要有圖片縮小方法:

def resize(self, maxwidth=1000, maxheight=1000):
    """
    基于最大寬高按比例重設圖片大小,
    注意:這可能影響檢測演算法的結果

    如果沒有變化回傳 0
    原寬度大于 maxwidth 回傳 1
    原高度大于 maxheight 回傳 2
    原寬高大于 maxwidth, maxheight 回傳 3

    maxwidth - 圖片最大寬度
    maxheight - 圖片最大高度
    傳遞引數時都可以設定為 False 來忽略

 

在這里插入圖片描述

"""
# 存盤回傳值
ret = 0
if maxwidth:
    if self.width > maxwidth:
        wpercent = (maxwidth / self.width)
        hsize = int((self.height * wpercent))
        fname = self.image.filename
        # Image.LANCZOS 是重采樣濾波器,用于抗鋸齒
        self.image = self.image.resize((maxwidth, hsize), Image.LANCZOS)
        self.image.filename = fname
        self.width, self.height = self.image.size
        self.total_pixels = self.width * self.height
        ret += 1
if maxheight:
    if self.height > maxheight:
        hpercent = (maxheight / float(self.height))
        wsize = int((float(self.width) * float(hpercent)))
        fname = self.image.filename
        self.image = self.image.resize((wsize, maxheight), Image.LANCZOS)
        self.image.filename = fname
        self.width, self.height = self.image.size
        self.total_pixels = self.width * self.height
        ret += 2
return ret
Image.resize(size, resample=0)

size – 包含寬高像素數的元祖 (width, height) resample – 可選的重采樣濾波器

回傳 Image 物件

然后便是最關鍵之一的決議方法了:
def parse(self):
    # 如果已有結果,回傳本物件
    if self.result is not None:
        return self
    # 獲得圖片所有像素資料
    pixels = self.image.load()

 

在這里插入圖片描述

接著,遍歷每個像素,為每個像素創建對應的 Skin 物件,其中 self._classify_skin() 這個方法是檢測像素顏色是否為膚色:

python學習交流Q群:906715085###
for y in range(self.height):
    for x in range(self.width):
        # 得到像素的 RGB 三個通道的值
        # [x, y] 是 [(x,y)] 的簡便寫法
        r = pixels[x, y][0]   # red
        g = pixels[x, y][1]   # green
        b = pixels[x, y][2]   # blue
        # 判斷當前像素是否為膚色像素
        isSkin = True if self._classify_skin(r, g, b) else False
        # 給每個像素分配唯一 id 值(1, 2, 3...height*width)
        # 注意 x, y 的值從零開始
        _id = x + y * self.width + 1
        # 為每個像素創建一個對應的 Skin 物件,并添加到 self.skin_map 中
        self.skin_map.append(self.Skin(_id, isSkin, None, x, y)
)

 

若當前像素并不是膚色,那么跳過本次回圈,繼續遍歷:

  # 若當前像素不為膚色像素,跳過此次回圈
    if not isSkin:
        continue

 

若當前像素是膚色像素,那么就需要處理了,先遍歷其相鄰像素,

一定要注意相鄰像素的索引值,因為像素的 id 值是從 1 開始編起的,而索引是從 0 編起的,變數 _id是存有當前像素的 id 值,

所以當前像素在 self.skin_map 中的索引值為 _id - 1,以此類推,那么其左方的相鄰像素在 self.skin_map 中的索引值為 _id - 1 -

1 ,左上方為 _id - 1 - self.width - 1,上方為 _id - 1 - self.width ,右上方為 _id - 1 - self.width + 1 :

# 設左上角為原點,相鄰像素為符號 *,當前像素為符號 ^,那么相互位置關系通常如下圖
    # ***
    # *^

    # 存有相鄰像素索引的串列,存放順序為由大到小,順序改變有影響
    # 注意 _id 是從 1 開始的,對應的索引則是 _id-1
    check_indexes = [_id - 2, # 當前像素左方的像素
                     _id - self.width - 2,  # 當前像素左上方的像素
                     _id - self.width - 1,  # 當前像素的上方的像素
                     _id - self.width]  # 當前像素右上方的像素

 

在這里插入圖片描述

id值從0編起:
       # 用來記錄相鄰像素中膚色像素所在的區域號,初始化為 -1
            region = -1
            # 遍歷每一個相鄰像素的索引
            for index in check_indexes:
                # 嘗試索引相鄰像素的 Skin 物件,沒有則跳出回圈
                try:
                    self.skin_map[index]
                except IndexError:
                    break
                # 相鄰像素若為膚色像素:
                if self.skin_map[index].skin:
                    # 若相鄰像素與當前像素的 region 均為有效值,且二者不同,且尚未添加相同的合并任務
                    if (self.skin_map[index].region != None and
                            region != None and region != -1 and
                            self.skin_map[index].region != region and
                            self.last_from != region and
                            self.last_to != self.skin_map[index].region) :
                        # 那么這添加這兩個區域的合并任務
                        self._add_merge(region, self.skin_map[index].region)
                    # 記錄此相鄰像素所在的區域號
                    region = self.skin_map[index].region

 

self._add_merge() 這個方法接收兩個區域號,它將會把兩個區域號添加到 self.merge_regions 中的元素中,self.merge_regions

的每一個元素都是一個串列,這些串列中存放了 1 到多個的區域號,區域號代表的區域是連通的,需要合并,

檢測的影像里,有些前幾行的像素的相鄰像素并沒有 4 個,所以需要用 try “試錯”,

然后相鄰像素的若是膚色像素,如果兩個像素的皮膚區域號都為有效值且不同,因為兩個區域中的像素相鄰,那么其實這兩個區

域是連通的,說明需要合并這兩個區域,記錄下此相鄰膚色像素的區域號,之后便可以將當前像素歸到這個皮膚區域里了,
在這里插入圖片描述

遍歷完所有相鄰像素后,分兩種情況處理:

1.所有相鄰像素都不是膚色像素:發現了新的皮膚區域,

2.存在區域號為有效值的相鄰膚色像素:region 的中存盤的值有用了,把當前像素歸到這個相鄰像素所在的區域,

  # 遍歷完所有相鄰像素后,若 region 仍等于 -1,說明所有相鄰像素都不是膚色像素
    if region == -1:
        # 更改屬性為新的區域號,注意元祖是不可變型別,不能直接更改屬性
        _skin = self.skin_map[_id - 1]._replace(region=len(self.detected_regions))
        self.skin_map[_id - 1] = _skin
        # 將此膚色像素所在區域創建為新區域
        self.detected_regions.append([self.skin_map[_id - 1]])
    # region 不等于 -1 的同時不等于 None,說明有區域號為有效值的相鄰膚色像素
    elif region != None:
        # 將此像素的區域號更改為與相鄰像素相同
        _skin = self.skin_map[_id - 1]._replace(region=region)
        self.skin_map[_id - 1] = _skin
        # 向這個區域的像素串列中添加此像素
        self.detected_regions[region].append(self.skin_map[_id - 1])

 

somenamedtuple._replace(kwargs) 回傳一個替換指定欄位的值為引數的 namedtuple實體

遍歷完所有像素之后,圖片的皮膚區域劃分初步完成了,只是在變數 self.merge_regions 中還有一些連通的皮膚區域號,它們需

要合并,合并之后就可以進行色情圖片判定了:

# 完成所有區域合并任務,合并整理后的區域存盤到 self.skin_regions
self._merge(self.detected_regions, self.merge_regions)
# 分析皮膚區域,得到判定結果
self._analyse_regions()
return self

 

方法 self._merge() 便是用來合并這些連通的皮膚區域的,方法 self._analyse_regions(),運用之前在程式原理一節定義的非色情

影像判定規則,從而得到判定結果,現在撰寫我們還沒寫過的呼叫過的 Nude 類的方法,

首先是 self._classify_skin() 方法,這個方法是檢測像素顏色是否為膚色,之前在程式原理一節已經把膚色判定該公式列舉了出

來,現在是用的時候了:

# 基于像素的膚色檢測技術
def _classify_skin(self, r, g, b):
    # 根據RGB值判定
    rgb_classifier = r > 95 and \
        g > 40 and g < 100 and \
        b > 20 and \
        max([r, g, b]) - min([r, g, b]) > 15 and \
        abs(r - g) > 15 and \
        r > g and \
        r > b
    # 根據處理后的 RGB 值判定
    nr, ng, nb = self._to_normalized(r, g, b)
    norm_rgb_classifier = nr / ng > 1.185 and \
        float(r * b) / ((r + g + b) ** 2) > 0.107 and \
        float(r * g) / ((r + g + b) ** 2) > 0.112

 

在這里插入圖片描述

# HSV 顏色模式下的判定
h, s, v = self._to_hsv(r, g, b)
hsv_classifier = h > 0 and \
    h < 35 and \
    s > 0.23 and \
    s < 0.68
# YCbCr 顏色模式下的判定
y, cb, cr = self._to_ycbcr(r, g,  b)
ycbcr_classifier = 97.5 <= cb <= 142.5 and 134 <= cr <= 176

# 效果不是很好,還需改公式
# return rgb_classifier or norm_rgb_classifier or hsv_classifier or ycbcr_classifier
return ycbcr_classifier

 

顏色模式的轉換并不是本實驗的重點,轉換公式可以在網上找到,這里我們直接拿來用就行:

def _to_normalized(self, r, g, b):
    if r == 0:
        r = 0.0001
    if g == 0:
        g = 0.0001
    if b == 0:
        b = 0.0001
    _sum = float(r + g + b)
    return [r / _sum, g / _sum, b / _sum]

def _to_ycbcr(self, r, g, b):
    # 公式來源:
    # http://stackoverflow.com/questions/19459831/rgb-to-ycbcr-conversion-problems
    y = .299*r + .587*g + .114*b
    cb = 128 - 0.168736*r - 0.331364*g + 0.5*b
    cr = 128 + 0.5*r - 0.418688*g - 0.081312*b
    return y, cb, cr

def _to_hsv(self, r, g, b):
    h = 0
    _sum = float(r + g + b)
    _max = float(max([r, g, b]))
    _min = float(min([r, g, b]))
    diff = float(_max - _min)
    if _sum == 0:
        _sum = 0.0001

    if _max == r:
        if diff == 0:
            h = sys.maxsize
        else:
            h = (g - b) / diff
    elif _max == g:
        h = 2 + ((g - r) / diff)
    else:
        h = 4 + ((r - g) / diff)

    h *= 60
    if h < 0:
        h += 360

    return [h, 1.0 - (3.0 * (_min / _sum)), (1.0 / 3.0) * _max]

 

self._add_merge() 方法主要是對 self.merge_regions 操作,而self.merge_regions 的元素都是包含一些 int 物件(區域號)的列

表,串列中的區域號代表的區域都是待合并的區,self._add_merge() 方法接收兩個區域號,將之添加到 self.merge_regions 中,
在這里插入圖片描述

這兩個區域號以怎樣的形式添加,要分 3 種情況處理:

1.傳入的兩個區域號都存在于 self.merge_regions 中


2.傳入的兩個區域號有一個區域號存在于 self.merge_regions 中


3.傳入的兩個區域號都不存在于 self.merge_regions 中

 

具體的處理方法,見代碼:

def _add_merge(self, _from, _to):
    # 兩個區域號賦值給類屬性
    self.last_from = _from
    self.last_to = _to
    
    # 記錄 self.merge_regions 的某個索引值,初始化為 -1
    from_index = -1
    # 記錄 self.merge_regions 的某個索引值,初始化為 -1
    to_index = -1


    # 遍歷每個 self.merge_regions 的元素
    for index, region in enumerate(self.merge_regions):
        # 遍歷元素中的每個區域號
        for r_index in region:
            if r_index == _from:
                from_index = index
            if r_index == _to:
                to_index = index

    # 若兩個區域號都存在于 self.merge_regions 中
    if from_index != -1 and to_index != -1:
        # 如果這兩個區域號分別存在于兩個串列中
        # 那么合并這兩個串列
        if from_index != to_index:
            self.merge_regions[from_index].extend(self.merge_regions[to_index])
            del(self.merge_regions[to_index])
        return

    # 若兩個區域號都不存在于 self.merge_regions 中
    if from_index == -1 and to_index == -1:
        # 創建新的區域號串列
        self.merge_regions.append([_from, _to])
        return
    # 若兩個區域號中有一個存在于 self.merge_regions 中
    if from_index != -1 and to_index == -1:
        # 將不存在于 self.merge_regions 中的那個區域號
        # 添加到另一個區域號所在的串列
        self.merge_regions[from_index].append(_to)
        return
    # 若兩個待合并的區域號中有一個存在于 self.merge_regions 中
    if from_index == -1 and to_index != -1:
        # 將不存在于 self.merge_regions 中的那個區域號
        # 添加到另一個區域號所在的串列
        self.merge_regions[to_index].append(_from)
        return

 

在這里插入圖片描述

在序列中回圈時,索引位置和對應值可以使用 enumerate() 函式同時得到,在上面的代碼中,索引位置即為 index ,對應值即為

region,self._merge() 方法則是將 self.merge_regions 中的元素中的區域號所代表的區域合并,得到新的皮膚區域串列:

def _merge(self, detected_regions, merge_regions):
    # 新建串列 new_detected_regions 
    # 其元素將是包含一些代表像素的 Skin 物件的串列
    # new_detected_regions 的元素即代表皮膚區域,元素索引為區域號
    new_detected_regions = []

    # 將 merge_regions 中的元素中的區域號代表的所有區域合并
    for index, region in enumerate(merge_regions):
        try:
            new_detected_regions[index]
        except IndexError:
            new_detected_regions.append([])
        for r_index in region:
            new_detected_regions[index].extend(detected_regions[r_index])
            detected_regions[r_index] = []

    # 添加剩下的其余皮膚區域到 new_detected_regions
    for region in detected_regions:
        if len(region) > 0:
            new_detected_regions.append(region)

    # 清理 new_detected_regions
    self._clear_regions(new_detected_regions)

        # 添加剩下的其余皮膚區域到 new_detected_regions
        for region in detected_regions:
            if len(region) > 0:
                new_detected_regions.append(region)

        # 清理 new_detected_regions
        self._clear_regions(new_detected_regions)

 

self._clear_regions() 方法只將像素數大于指定數量的皮膚區域保留到 self.skin_regions :

# 皮膚區域清理函式
# 只保存像素數大于指定數量的皮膚區域
def _clear_regions(self, detected_regions):
    for region in detected_regions:
        if len(region) > 30:
            self.skin_regions.append(region)


self._analyse_regions() 是很簡單的,它的作業只是進行一系列判斷,得出圖片是否色情的結論:
# 分析區域
def _analyse_regions(self):
    # 如果皮膚區域小于 3 個,不是色情
    if len(self.skin_regions) < 3:
        self.message = "Less than 3 skin regions ({_skin_regions_size})".format(
            _skin_regions_size=len(self.skin_regions))
        self.result = False
        return self.result

    # 為皮膚區域排序
    self.skin_regions = sorted(self.skin_regions, key=lambda s: len(s),
                               reverse=True)

    # 計算皮膚總像素數
    total_skin = float(sum([len(skin_region) for skin_region in self.skin_regions]))

    # 如果皮膚區域與整個影像的比值小于 15%,那么不是色情圖片
    if total_skin / self.total_pixels * 100 < 15:
        self.message = "Total skin percentage lower than 15 ({:.2f})".format(total_skin / self.total_pixels * 100)
        self.result = False
        return self.result

    # 如果最大皮膚區域小于總皮膚面積的 45%,不是色情圖片
    if len(self.skin_regions[0]) / total_skin * 100 < 45:
        self.message = "The biggest region contains less than 45 ({:.2f})".format(len(self.skin_regions[0]) / total_skin * 100)
        self.result = False
        return self.result

    # 皮膚區域數量超過 60個,不是色情圖片
    if len(self.skin_regions) > 60:
        self.message = "More than 60 skin regions ({})".format(len(self.skin_regions))
        self.result = False
        return self.result

    # 其它情況為色情圖片
    self.message = "Nude!!"
    self.result = True
    return self.result


然后可以組織下分析得出的資訊:
def inspect(self):
    _image = '{} {} {}×{}'.format(self.image.filename, self.image.format, self.width, self.height)
    return "{_image}: result={_result} message='{_message}'".format(_image=_image, _result=self.result, _message=self.message)

 

在這里插入圖片描述

Nude 類如果就這樣完成了,最后運行腳本時只能得到一些真或假的結果,我們需要更直觀的感受程式的分析效果,我們可以生成

一張原圖的副本,不過這個副本圖片中只有黑白色,白色代表皮膚區域,那么這樣我們能直觀感受到程式分析的效果了,

前面的代碼中我們有獲得影像的像素的 RGB 值的操作,設定像素的 RGB 值也就是其逆操作,還是很簡單的,不過注意設定像素的 RGB 值時不能在原圖上操作:

python學習交流Q群:906715085###
# 將在源檔案目錄生成圖片檔案,將皮膚區域可視化
def showSkinRegions(self):
    # 未得出結果時方法回傳
    if self.result is None:
        return
    # 皮膚像素的 ID 的集合
    skinIdSet = set()
    # 將原圖做一份拷貝
    simage = self.image
    # 加載資料
    simageData =https://www.cnblogs.com/1234567FENG/p/ simage.load()

    # 將皮膚像素的 id 存入 skinIdSet
    for sr in self.skin_regions:
        for pixel in sr:
            skinIdSet.add(pixel.id)
    # 將影像中的皮膚像素設為白色,其余設為黑色
    for pixel in self.skin_map:
        if pixel.id not in skinIdSet:
            simageData[pixel.x, pixel.y] = 0, 0, 0
        else:
            simageData[pixel.x, pixel.y] = 255, 255, 255
    # 源檔案絕對路徑
    filePath = os.path.abspath(self.image.filename)
    # 源檔案所在目錄
    fileDirectory = os.path.dirname(filePath) + '/'
    # 源檔案的完整檔案名
    fileFullName = os.path.basename(filePath)
    # 分離源檔案的完整檔案名得到檔案名和擴展名
    fileName, fileExtName = os.path.splitext(fileFullName)
    # 保存圖片
    simage.save('{}{}_{}{}'.format(fileDirectory, fileName,'Nude' if self.result else 'Normal', fileExtName))

 

變數 skinIdSet 使用集合而不是串列是有性能上的考量的,Python 中的集合是哈希表實作的,查詢效率很高,最后支持一下命令

行引數就大功告成啦!我們使用 argparse 這個模塊來實作命令列的支持,argparse 模塊使得撰寫用戶友好的命令列介面非常容

易,程式只需定義好它要求的引數,然后 argparse 將負責如何從 sys.argv 中決議出這些引數,argparse 模塊還會自動生成幫助

和使用資訊并且當用戶賦給程式非法的引數時產生錯誤資訊,

具體使用方法請查看argparse的 官方檔案

if __name__ == "__main__":
    import argparse

    parser = argparse.ArgumentParser(description='Detect nudity in images.')
    parser.add_argument('files', metavar='image', nargs='+',
                        help='Images you wish to test')
    parser.add_argument('-r', '--resize', action='store_true',
                        help='Reduce image size to increase speed of scanning')
    parser.add_argument('-v', '--visualization', action='store_true',
                        help='Generating areas of skin image')

    args = parser.parse_args()

    for fname in args.files:
        if os.path.isfile(fname):
            n = Nude(fname)
            if args.resize:
                n.resize(maxheight=800, maxwidth=600)
            n.parse()
            if args.visualization:
                n.showSkinRegions()
            print(n.result, n.inspect())
        else:
            print(fname, "is not a file")

 

測驗效果

先來一張很正經的測驗圖片:

圖片違規了,系統不讓我發....

在這里插入圖片描述

在PyCharm中的終端運行下面的命令執行腳本,注意是python3而不是python:
python3 nude.py -v 1.jpg

運行截圖:

在這里插入圖片描述

這表示1.jpg不是一張色情圖片

總結

這個專案就是熟悉了一下PIL的使用,了解了色情圖片檢查的原理,主要實作難點是在皮膚區域的檢測與整合這一方面,專案還有

許多可以改進的地方,比如膚色檢測公式,色情判定條件,還有性能問題,我得去學習一下用多執行緒或多行程提高性能,關于這

篇文章,喜歡的小伙伴記得點贊收藏,關注我才能看更多有意思的,有不懂的地方記得評論留言喲!!

在這里插入圖片描述

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/492242.html

標籤:Python

上一篇:Python之B站視頻獲取

下一篇:One---python的六種資料型別及資料轉換

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more