Question

我正在使用tesseract的OCR功能。我有一些屏幕截图，我正在尝试指定图像的区域以查找文本。我在互联网上找不到任何东西。

这就是我要执行的功能，但是如何使它仅在坐标中搜索。

def find_text(image):
    #scan image for text
    img_text = pytesseract.image_to_string(image)
    #parse text to remove commas
    img_text.replace(",", "")
    #return the text
    return img_text

我有一些要搜索的坐标，但是我不知道该怎么做。我也可以在OpenCV中使用cv2.bitwise_and()进行遮罩。如果有人知道如何指定感兴趣的区域，请告诉我。谢谢

Answer 1

似乎可以用“ uzn”文件指出哪个区域文件的文本可用。

如前所述：uzn文件的扩展名应与“ uzn”文件相同。

我发现git repo用于在Tesseract中使用uzn文件

请参见this的this

tesseract指定要查找文本的区域

1 个答案: