tesseract指定要查找文本的区域

时间:2019-04-12 18:00:53

标签: python-3.x

我正在使用tesseract的OCR功能。我有一些屏幕截图,我正在尝试指定图像的区域以查找文本。我在互联网上找不到任何东西。

这就是我要执行的功能,但是如何使它仅在坐标中搜索。

def find_text(image):
    #scan image for text
    img_text = pytesseract.image_to_string(image)
    #parse text to remove commas
    img_text.replace(",", "")
    #return the text
    return img_text

我有一些要搜索的坐标,但是我不知道该怎么做。我也可以在OpenCV中使用cv2.bitwise_and()进行遮罩。 如果有人知道如何指定感兴趣的区域,请告诉我。 谢谢

1 个答案:

答案 0 :(得分:0)

似乎可以用“ uzn”文件指出哪个区域 文件的文本可用。

如前所述:uzn文件的扩展名应与“ uzn”文件相同。

我发现git repo用于在Tesseract中使用uzn文件

请参见thisthis