主頁 >  其他 > 百度飛槳(PaddlePaddle) - PaddleOCR 文字識別簡單使用

百度飛槳(PaddlePaddle) - PaddleOCR 文字識別簡單使用

2023-05-16 12:12:45 其他

百度飛槳(PaddlePaddle)安裝
OCR 文字檢測(Differentiable Binarization --- DB)

OCR的技術路線

image
PaddleHub 預訓練模型的網路結構是 DB + CRNN, 可微的二值化模塊(Differentiable Binarization,簡稱DB)
CRNN(Convolutional Recurrent Neural Network)即卷積遞回神經網路, 是DCNN和RNN的組合

DB(Differentiable Binarization)是一種基于分割的文本檢測演算法,將二值化閾值加入訓練中學習,可以獲得更準確的檢測邊界,從而簡化后處理流程,DB演算法最終在5個資料集上達到了state-of-art的效果和性能
image

CRNN(Convolutional Recurrent Neural Network)即卷積遞回神經網路,是DCNN和RNN的組合,專門用于識別影像中的序列式物件,與CTC loss配合使用,進行文字識別,可以直接從文本詞級或行級的標注中學習,不需要詳細的字符級的標注

image

安裝庫

Building wheel for opencv-python (pyproject.toml):https://www.cnblogs.com/vipsoft/p/17386638.html

# 安裝 PaddlePaddle
python -m pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple

# 安裝 PaddleHub Mac 電腦上終端會感覺卡死的狀態,可以添加   --verbose,查看進度
pip install paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple  --verbose

# 該Module依賴于第三方庫shapely、pyclipper,使用該Module之前,請先安裝shapely、pyclipper
pip install shapely -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install pyclipper -i https://pypi.tuna.tsinghua.edu.cn/simple

定義待預測資料

將預測圖片存放在一個檔案中 picture.txt

./images/231242.jpg
./images/234730.jpg

測驗輸出

import matplotlib.pyplot as plt
import matplotlib.image as mpimg

# 將預測圖片存放在一個檔案中(picture.txt)
with open('picture.txt', 'r') as f:
    test_img_path=[]
    for line in f:
        test_img_path.append(line.strip())
        # 顯示圖片
        img1 = mpimg.imread(line.strip())
        plt.figure(figsize=(10, 10))
        plt.imshow(img1)
        plt.axis('off')
        plt.show()

print(test_img_path) # => ['images/231242.jpg', 'images/234730.jpg']

image

加載預訓練模型

PaddleHub提供了以下文字識別模型:

移動端的超輕量模型:僅有8.1M,chinese_ocr_db_crnn_mobile

服務器端的精度更高模型:識別精度更高,chinese_ocr_db_crnn_server,

識別文字演算法均采用CRNN(Convolutional Recurrent Neural Network)即卷積遞回神經網路,其是DCNN和RNN的組合,專門用于識別影像中的序列式物件,與CTC loss配合使用,進行文字識別,可以直接從文本詞級或行級的標注中學習,不需要詳細的字符級的標注,該Module支持直接預測, 移動端與服務器端主要在于骨干網路的差異性,移動端采用MobileNetV3,服務器端采用ResNet50_vd

import paddlehub as hub

# 加載移動端預訓練模型
# ocr = hub.Module(name="chinese_ocr_db_crnn_mobile")

# 服務端可以加載大模型,效果更好
ocr = hub.Module(name="chinese_ocr_db_crnn_server")

image

預測

PaddleHub對于支持一鍵預測的module,可以呼叫module的相應預測API,完成預測功能,
module 'numpy' has no attribute 'int'.: 解方法見:https://www.cnblogs.com/vipsoft/p/17385169.html

import paddlehub as hub
import cv2

# 加載移動端預訓練模型
ocr = hub.Module(name="chinese_ocr_db_crnn_mobile")

# 服務端可以加載大模型,效果更好 -- 【個人電腦,記憶體不夠用】
# ocr = hub.Module(name="chinese_ocr_db_crnn_server")

# 將預測圖片存放在一個檔案中(picture.txt)
test_img_path = []
with open('picture.txt', 'r') as f:
    for line in f:
        test_img_path.append(line.strip())
print("預測圖片 => ", test_img_path)

# 讀取測驗檔案夾test.txt中的照片路徑
np_images = [cv2.imread(image_path) for image_path in test_img_path]

results = ocr.recognize_text(
    images=np_images,  # 圖片資料,ndarray.shape 為 [H, W, C],BGR格式;
    use_gpu=False,  # 是否使用 GPU;若使用GPU,請先設定CUDA_VISIBLE_DEVICES環境變數
    output_dir='ocr_result',  # 圖片的保存路徑,默認設為 ocr_result;
    visualization=True,  # 是否將識別結果保存為圖片檔案;
    box_thresh=0.5,  # 檢測文本框置信度的閾值;
    text_thresh=0.5)  # 識別中文文本置信度的閾值;

for result in results:
    data = https://www.cnblogs.com/vipsoft/p/result['data']
    save_path = result['save_path']
    for infomation in data:
        print('text: ', infomation['text'], '\nconfidence: ', infomation['confidence'], '\ntext_box_position: ', infomation['text_box_position'])

輸出

"D:\Program Files\Python38\python.exe" D:/OpenSource/PaddlePaddle/OCR/OCRTest.py
預測圖片 =>  ['./images/123.jpg']
text:  中華人民共和國 
confidence:  0.9990600347518921 
text_box_position:  [[188, 37], [472, 32], [472, 65], [188, 70]]
text:  居民身份證 
confidence:  0.9996429681777954 
text_box_position:  [[171, 96], [492, 96], [492, 140], [171, 140]]
text:  簽發機關 
confidence:  0.9993374347686768 
text_box_position:  [[140, 242], [217, 242], [217, 263], [140, 263]]
text:  蘇州市公安局工業園區分局 
confidence:  0.9997307658195496 
text_box_position:  [[233, 242], [473, 242], [473, 262], [233, 262]]
text:  有效期限 
![image](https://img2023.cnblogs.com/blog/80824/202305/80824-20230509152736239-145300739.png)

image

image

image

百度飛槳:https://aistudio.baidu.com/aistudio/projectdetail/507159

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/552516.html

標籤:其他

上一篇:云原生周刊:GitOps 的 4 條核心原則

下一篇:返回列表

標籤雲
其他(159075) Python(38137) JavaScript(25421) Java(18044) C(15226) 區塊鏈(8267) C#(7972) AI(7469) 爪哇(7425) MySQL(7186) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1973) 功能(1967) Web開發(1951) HtmlCss(1936) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1876) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 百度飛槳(PaddlePaddle) - PaddleOCR 文字識別簡單使用

    百度飛槳(PaddlePaddle)安裝 OCR 文字檢測(Differentiable Binarization DB) OCR的技術路線 PaddleHub 預訓練模型的網路結構是 DB + CRNN, 可微的二值化模塊(Differentiable Binarization,簡稱DB) CRN ......

    uj5u.com 2023-05-16 12:12:45 more
  • 云原生周刊:GitOps 的 4 條核心原則

    日前在溫哥華舉行的 cdCON + GitOpsCon 上,分享內容以 GitOps 原則為特色: GitOps 是宣告式的; GitOps 應用程式是版本化的和不可變的; 自動拉取 GitOps 應用程式; GitOps 應用程式不斷協調。 原文鏈接:https://thenewstack.io/ ......

    uj5u.com 2023-05-16 12:06:17 more
  • 玩轉服務器之環境篇:PHP和Python環境部署指南

    前幾篇文章中講解了如何搭建docker和Java Web環境的方法,本篇文章來教大家搭建一個好的PHP和Python環境,可以幫助開發和運行PHP和Python應用程式,使其更加高效和穩定。 一、 PHP環境介紹 好的開發環境無疑會大大提升編碼效率,近日鉆研了一下Python環境安裝的問題,稍加總結 ......

    uj5u.com 2023-05-16 12:06:12 more
  • 華為云云原生視窗:一文回顧Q1精彩瞬間

    摘要:一文速覽2023年Q1期間華為云云原生相關動態資訊。 華為云云原生動態 華為云海外首發CCI Serverless容器服務 在MWC23 巴展期間,華為云海外首發CCI Serverless容器服務正式上線。其具備聚焦應用免運維、極致計算性能、智能統籌彈性等優勢…… Serverless容器構 ......

    uj5u.com 2023-05-16 12:06:01 more
  • 寶蘭德應用服務器軟體與華為云GaussDB完成兼容互認證

    摘要:北京寶蘭德軟體股份有限公司攜手華為云完成寶蘭德應用服務器軟體9.5與GaussDB資料庫兼容性測驗,并獲得華為云授予的技術認證書。 本文分享自華為云社區《寶蘭德應用服務器軟體與華為云GaussDB完成兼容互認證》,作者:GaussDB 資料庫。 近日,北京寶蘭德軟體股份有限公司(簡稱:寶蘭德) ......

    uj5u.com 2023-05-16 12:05:43 more
  • KubeSphere 社區雙周報 | 開源之夏已啟動 | 2023.04.28-05.11

    KubeSphere 社區雙周報主要整理展示新增的貢獻者名單和證書、新增的講師證書以及兩周內提交過 commit 的貢獻者,并對近期重要的 PR 進行決議,同時還包含了線上/線下活動和布道推廣等一系列社區動態。 本次雙周報涵蓋時間為:2023.04.28-2023.05.11。 貢獻者名單 新晉 K ......

    uj5u.com 2023-05-16 12:05:25 more
  • ET框架6.0分析三、網路通信

    概述 ET框架的訊息機制貫徹始終,包含Entity訊息(Awake,Update ...),自定義(Customer)訊息,網路訊息等。而ET系統的行程包含了客戶端、Gate等各種型別的服務器,行程包含各種服務器客戶端之間通過網路訊息進行通信進行作業。 ET框架訊息結構 結構圖為了更加明確整體關系, ......

    uj5u.com 2023-05-16 12:05:01 more
  • 一種通用的業務監控觸發方案設計

    業務監控是指通過技術手段監控業務代碼執行的最終結果或者狀態是否符合預期,實作業務監控主要分成兩步:一、在業務系統中選擇節點發送訊息觸發業務監控;二、系統在接收到mq訊息或者定時任務調度時,根據訊息中或者任務中的業務資料查詢業務執行的結果或狀態并與業務預期的結果相對比。目前供銷系統的方案如下: ......

    uj5u.com 2023-05-16 12:04:09 more
  • 基于Sentinel自研組件的系統限流、降級、負載保護最佳實踐探索

    作者:京東物流 楊建民 一、Sentinel簡介 Sentinel 以流量為切入點,從流量控制、熔斷降級、系統負載保護等多個維度保護服務的穩定性。 Sentinel 具有以下特征: 豐富的應用場景:秒殺(即突發流量控制在系統容量可以承受的范圍)、訊息削峰填谷、集群流量控制、實時熔斷下游不可用應用等。 ......

    uj5u.com 2023-05-16 12:04:05 more
  • zabbix電話報警技巧

    Zabbix是一款開源的企業級監控系統,可以監控網路、服務器、應用程式等各種資源。在監控程序中,及時的告警通知是非常重要的,本文將介紹如何在Zabbix中配置電話、短信、飛書、釘釘、微信和郵件報警。 前置條件 已經安裝并配置好了Zabbix5以上版本監控系統。 提前下載電話短信報警媒介:https: ......

    uj5u.com 2023-05-16 12:03:22 more