我正在使用 python 在影像上運行 OCR,然后獲取每個單詞的坐標并對其執行遮罩和修復。這是我目前的結果

如您所見,在影像頂部,文本未正確修復。我通過使用 OPENCV 以及手動繪制文本的坐標來解決這個問題。我注意到 Opencv 僅以水平或垂直矩形方式或垂直矩形方式執行裁剪,如下所示:

如果我在像paint這樣的影像編輯工具上使用相同的坐標繪制相同的影像,我會得到正確的邊界框,即
我不希望這種情況發生,因為它會影響我的結果。我該如何改進?
代碼:
textCoordinates = runOcr(img)
for i in textCoordinates:
tl[1],br[1],tl[0],br[0]] = i.coordinates
smImg = img[tl[1]:br[1],tl[0]:br[0]]
inpaintedImg = inpaintAlgo(smImg) ## this function detects and creates a mask and inpaints by it.
uj5u.com熱心網友回復:
假設你有 4 分
[[x1,y1],[x2,y2],[x3,y3],[x4,y4]]
你需要計算 ymin, ymax, xmin, xmax 為
ymin = min(y1,y2,y3,y4)
ymax = max(y1,y2,y3,y4)
xmin = min(x1,x2,x3,x4)
xmax = max(x1,x2,x3,x4)
然后你的收成將是
img[ymin:ymax,xmin:xmax]
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/512307.html
