我正在使用Tesseract OCR Engine将智能手机屏幕截图转换为文本内容。但我也希望在Tesseract认可的文本区域中绘制边界框。为此,我正在使用一个库并获取边界框坐标,但我无法在新图像中的每个文本行中绘制矩形边界框。
这是我的代码,用于获取边界框的坐标以及图像的文本内容。
from PIL import Image
from tesserocr import PyTessBaseAPI, RIL, iterate_level
image = Image.open('test.png')
with PyTessBaseAPI() as api:
api.SetImage(image)
api.Recognize()
ri = api.GetIterator()
# print api.GetThresholdedImage().show()
for r in iterate_level(ri, RIL.TEXTLINE):
# rectangle
print r.BoundingBox(RIL.TEXTLINE)
# text
print r.GetUTF8Text(RIL.TEXTLINE)