主頁 >  其他 > 使用 OpenCV 和 Python 識別數字

使用 OpenCV 和 Python 識別數字

2021-11-09 07:12:42 其他

使用 OpenCV 和 Python 識別數字

本文演示如何使用 OpenCV 和 Python 識別影像中的數字,

在本教程的第一部分,我們將討論什么是七段顯示幕,以及我們如何應用計算機視覺和影像處理操作來識別這些型別的數字(不需要機器學習!)

七段顯示

您可能已經熟悉七段顯示幕,即使您不認識特定術語, 這種顯示的一個很好的例子是您的經典數字鬧鐘:

image-20211108135630394

鬧鐘上的每個數字都由一個七段組件表示,如下所示:

image-20211108140852713

七段顯示幕總共可以呈現 128 種可能的狀態:

image-20211108140904381

我們只對其中的 10 個感興趣——數字 0 到 9:

image-20211108140913319

我們的目標是撰寫 OpenCV 和 Python 代碼來識別影像中的這十個數字狀態中的每一個,

設計OpenCV 數字識別器

我們將使用恒溫器影像作為輸入:

image-20211108140921872

識別的步驟:

步驟 1:定位恒溫器上的 LCD, 這可以使用邊緣檢測來完成,因為塑料外殼和 LCD 之間有足夠的對比度,

步驟2:提取 LCD, 給定一個輸入邊緣圖,我可以找到輪廓并尋找矩形的輪廓——最大的矩形區域應該對應于 LCD, 透視變換會給我一個很好的 LCD 提取,

步驟3:提取數字區域, 一旦我有了 LCD 本身,我就可以專注于提取數字, 由于數字區域和 LCD 背景之間似乎存在對比,我相信閾值和形態操作可以實作這一點,

步驟4:識別數字, 使用 OpenCV 識別實際數字將涉及將數字 ROI 劃分為七個部分, 從那里我可以在閾值影像上應用像素計數來確定給定的片段是“開”還是“關”,

所以看看我們如何使用 OpenCV 和 Python 完成這個四步程序來進行數字識別,繼續閱讀,

使用計算機視覺和 OpenCV 識別數字

讓我們繼續開始這個例子,新建一個檔案,將其命名為 identify_digits.py ,并插入以下代碼:

# import the necessary packages
from imutils.perspective import four_point_transform
from imutils import contours
import imutils
import cv2
# define the dictionary of digit segments so we can identify
# each digit on the thermostat
DIGITS_LOOKUP = {
	(1, 1, 1, 0, 1, 1, 1): 0,
	(0, 0, 1, 0, 0, 1, 0): 1,
	(1, 0, 1, 1, 1, 1, 0): 2,
	(1, 0, 1, 1, 0, 1, 1): 3,
	(0, 1, 1, 1, 0, 1, 0): 4,
	(1, 1, 0, 1, 0, 1, 1): 5,
	(1, 1, 0, 1, 1, 1, 1): 6,
	(1, 0, 1, 0, 0, 1, 0): 7,
	(1, 1, 1, 1, 1, 1, 1): 8,
	(1, 1, 1, 1, 0, 1, 1): 9
}

匯入我們所需的 Python 包, 引入mutils,這是我的一系列便利函式,可以更輕松地使用 OpenCV + Python, 如果您還沒有安裝 imutils,現在應該花一點時間使用 pip 在您的系統上安裝該軟體包: 使用 OpenCV 和 Python 識別數字

pip install imutils

定義一個名為 DIGITS_LOOKUP 的 Python 字典, 他們對表的關鍵是七段陣列, 陣列中的 1 表示給定的段已打開,零表示該段已關閉, 該值是實際數字本身:0-9,

一旦我們識別了恒溫器顯示幕中的段,我們就可以將陣列傳遞到我們的 DIGITS_LOOKUP 表中并獲得數字值, 作為參考,該詞典使用與上面圖 2 中相同的段順序, 讓我們繼續我們的例子:

# load the example image
image = cv2.imread("example.jpg")
# pre-process the image by resizing it, converting it to
# graycale, blurring it, and computing an edge map
image = imutils.resize(image, height=500)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 50, 200, 255)

加載我們的影像,

然后我們通過以下方式預處理影像:-

  • 調整大小,
  • 將影像轉換為灰度,
  • 使用 5×5 內核應用高斯模糊以減少高頻噪聲,
  • 通過 Canny 邊緣檢測器計算邊緣圖,

應用這些預處理步驟后,我們的邊緣圖如下所示:

image-20211108140933252

注意 LCD 的輪廓是如何清晰可見的——這完成了步驟 #1, 我們現在可以繼續第 2 步,提取 LCD 本身:

# find contours in the edge map, then sort them by their
# size in descending order
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,
	cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
displayCnt = None
# loop over the contours
for c in cnts:
	# approximate the contour
	peri = cv2.arcLength(c, True)
	approx = cv2.approxPolyDP(c, 0.02 * peri, True)
	# if the contour has four vertices, then we have found
	# the thermostat display
	if len(approx) == 4:
		displayCnt = approx
		break

為了找到 LCD 區域,我們需要提取邊緣圖中區域的輪廓(即輪廓),

然后我們按面積對等高線進行排序,確保將面積較大的等高線放在串列的前面,

給定我們排序的輪廓串列,逐個回圈它們并應用輪廓近似,

如果我們的近似輪廓有四個頂點,那么我們假設我們已經找到了恒溫器顯示, 這是一個合理的假設,因為我們輸入影像中最大的矩形區域應該是 LCD 本身,

獲得四個頂點后,我們可以通過四點透視變換提取 LCD:

# extract the thermostat display, apply a perspective transform
# to it
warped = four_point_transform(gray, displayCnt.reshape(4, 2))
output = four_point_transform(image, displayCnt.reshape(4, 2))

應用這種透視變換為我們提供了一個自上而下的 LCD 鳥瞰圖:

image-20211108140948248

獲得 LCD 的這個視圖滿足第 2 步——我們現在準備從 LCD 中提取數字:

# threshold the warped image, then apply a series of morphological
# operations to cleanup the thresholded image
thresh = cv2.threshold(warped, 0, 255,
	cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (1, 5))
thresh = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel)

為了獲得數字本身,我們需要對扭曲影像進行閾值處理,以在較亮的背景(即 LCD 顯示屏的背景)中顯示暗區(即數字):

image-20211108140956034

然后我們應用一系列形態學操作來清理閾值影像:

image-20211108141005262

現在我們有一個很好的分割影像,我們再次需要應用輪廓過濾,只是這次我們正在尋找實際的數字:

# find contours in the thresholded image, then initialize the
# digit contours lists
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,
	cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)
digitCnts = []
# loop over the digit area candidates
for c in cnts:
	# compute the bounding box of the contour
	(x, y, w, h) = cv2.boundingRect(c)
	# if the contour is sufficiently large, it must be a digit
	if w >= 15 and (h >= 30 and h <= 40):
		digitCnts.append(c)

為此,我們在閾值影像中找到輪廓, 初始化digitsCnts 串列——這個串列將存盤數字本身的輪廓,

在每個輪廓上回圈,

對于每個輪廓,我們計算邊界框,確保寬度和高度是可接受的大小,如果是,則更新digitsCnts 串列,

如果我們回圈遍歷digitsCnts內部的輪廓并在影像上繪制邊界框,結果將如下所示:

image-20211108141017066

果然,我們在液晶顯示屏上找到了數字! 最后一步是實際識別每個數字:

# sort the contours from left-to-right, then initialize the
# actual digits themselves
digitCnts = contours.sort_contours(digitCnts,
	method="left-to-right")[0]
digits = []

在這里,我們只是根據 (x, y) 坐標從左到右對數字輪廓進行排序,

這個排序步驟是必要的,因為不能保證輪廓已經從左到右排序(與我們讀取數字的方向相同),

接下來是實際的數字識別程序:

# loop over each of the digits
for c in digitCnts:
	# extract the digit ROI
	(x, y, w, h) = cv2.boundingRect(c)
	roi = thresh[y:y + h, x:x + w]
	# compute the width and height of each of the 7 segments
	# we are going to examine
	(roiH, roiW) = roi.shape
	(dW, dH) = (int(roiW * 0.25), int(roiH * 0.15))
	dHC = int(roiH * 0.05)
	# define the set of 7 segments
	segments = [
		((0, 0), (w, dH)),	# top
		((0, 0), (dW, h // 2)),	# top-left
		((w - dW, 0), (w, h // 2)),	# top-right
		((0, (h // 2) - dHC) , (w, (h // 2) + dHC)), # center
		((0, h // 2), (dW, h)),	# bottom-left
		((w - dW, h // 2), (w, h)),	# bottom-right
		((0, h - dH), (w, h))	# bottom
	]
	on = [0] * len(segments)

遍歷每個數字輪廓,

對于這些區域中的每一個,我們計算邊界框并提取數字 ROI,

我在下面包含了每個數字 ROI 的 GIF 影片:

在這里插入圖片描述

給定數字 ROI,我們現在需要定位和提取數字顯示的七個部分,

根據 ROI 尺寸計算每個段的大致寬度和高度, 然后我們定義一個 (x, y) 坐標串列,這些坐標對應七個線段, 此串列遵循與上面圖 2 相同的段順序, 這是一個示例 GIF 影片,它在正在調查的當前片段上繪制一個綠色框:

Figure 12: An example of drawing the segment ROI for each of the seven segments of the digit.

最后,初始化我們的 on 串列——該串列中的值 1 表示給定的段是“打開”的,而值為零表示該段是“關閉的”, 給定七個顯示段的 (x, y) 坐標,識別一個段是打開還是關閉是相當容易的:

# loop over the segments
	for (i, ((xA, yA), (xB, yB))) in enumerate(segments):
		# extract the segment ROI, count the total number of
		# thresholded pixels in the segment, and then compute
		# the area of the segment
		segROI = roi[yA:yB, xA:xB]
		total = cv2.countNonZero(segROI)
		area = (xB - xA) * (yB - yA)
		# if the total number of non-zero pixels is greater than
		# 50% of the area, mark the segment as "on"
		if total / float(area) > 0.5:
			on[i]= 1
	# lookup the digit and draw it on the image
	digit = DIGITS_LOOKUP[tuple(on)]
	digits.append(digit)
	cv2.rectangle(output, (x, y), (x + w, y + h), (0, 255, 0), 1)
	cv2.putText(output, str(digit), (x - 10, y - 10),
		cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 255, 0), 2)

我們開始回圈遍歷每個線段的 (x, y) 坐標,

我們提取片段 ROI,然后計算非零像素數(即片段中“開啟”的像素數),

如果非零像素與段總面積的比率大于 50%,那么我們可以假設該段是“on”并相應地更新我們的 on 串列, 在回圈七段之后,我們可以將串列傳遞給 DIGITS_LOOKUP 以獲取數字本身,

然后我們在數字周圍繪制一個邊界框并在輸出影像上顯示數字, 最后,我們的最后一個代碼塊將數字列印到我們的螢屏上并顯示輸出影像:

# display the digits
print(u"{}{}.{} \u00b0C".format(*digits))
cv2.imshow("Input", image)
cv2.imshow("Output", output)
cv2.waitKey(0)

請注意我們如何使用 Python 和 OpenCV 正確識別 LCD 螢屏上的數字:

image-20211108141044971

總結

在今天的博客文章中,我演示了如何利用 OpenCV 和 Python 來識別影像中的數字,

這種方法專門用于七段顯示幕(即您通常會在數字鬧鐘上看到的數字顯示幕),

通過提取七個段中的每一個并應用基本的閾值和形態學操作,我們可以確定哪些段是“開”的,哪些是“關”的,

從那里,我們可以在 Python 字典資料結構中查找開/關段以快速確定實際數字——無需機器學習!

正如我在這篇博文的開頭提到的,應用計算機視覺來識別恒溫器影像中的數字往往會使問題本身過于復雜——使用資料記錄溫度計會更可靠,并且需要的作業量要少得多,

我希望你喜歡今天的博文!

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/353251.html

標籤:AI

上一篇:2021愛智先行者—軟體入門及遠程無線控制應用

下一篇:[Python從零到壹] 十八.可視化分析之Basemap地圖包入門詳解

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more