应用错误收集

我正在使用Tesseract OCR Engine将智能手机屏幕截图转换为文本内容。但我也希望在Tesseract认可的文本区域中绘制边界框。为此，我正在使用一个库并获取边界框坐标，但我无法在新图像中的每个文本行中绘制矩形边界框。

这是我的代码，用于获取边界框的坐标以及图像的文本内容。

from PIL import Image
from tesserocr import PyTessBaseAPI, RIL, iterate_level

image = Image.open('test.png')

with PyTessBaseAPI() as api:
    api.SetImage(image)
    api.Recognize()
    ri = api.GetIterator()
    # print api.GetThresholdedImage().show()
    for r in iterate_level(ri, RIL.TEXTLINE):
        # rectangle
        print r.BoundingBox(RIL.TEXTLINE)
        # text
        print r.GetUTF8Text(RIL.TEXTLINE)

如何在识别的文本行中使用Tesseract OCR Engine获取边界框

0 个答案: