一、下載tesseract并安裝
tesserocr其實是對tesseract做的一層Python API封裝,它的核心是tesseract,所以在安裝tesserocr之前需要先安裝tesseract
首先下載whl檔案:
下載地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

選擇相應版本,我選擇的是:

打開cmd,進入whl檔案當前所在目錄下,進行安裝
pip install tesserocr-2.4.0-cp36-cp36m-win_amd64.whl
二、為tesseract及其tessdata配置環境變數

命令列輸出:

三、安裝tesserocr
pip install tesserocr -i https://pypi.doubanio.com/simple
三、測驗tesseract和tesserocr
- 用命令列測驗,進入測驗圖片所在目錄
#保存到檔案,檔案名為“result.txt” tesseract image.png result -l eng #或者不保存檔案,直接輸出 tesseract image.png stdout -l eng
- 利用python代碼來測驗
import tesserocr from PIL import Image
#注:路徑中不能有中文字符 image = Image.open('image.png') print(tesserocr.image_to_text(image))
四、可能遇到的錯誤
錯誤:invalid tessdata path:磁盤:\\
解決方法:將tesseract下的tessdata檔案夾拷貝到錯誤提示下的磁盤目錄下
更多精彩內容 請掃碼關注個人公眾號,帶你成為IT精英
—— —— —— —— — END —— —— —— —— ————
歡迎掃碼關注我的公眾號
小鴻星空科技

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/308224.html
標籤:Python
上一篇:變數_基礎知識
