我正在使用pytesseract从图像中提取文本。
from PIL import Image
from pytesseract import image_to_string, image_to_boxes, image_to_data
img = Image.open('device.png')
print(image_to_boxes(img))
print(image_to_data(img))
print(image_to_string(img))
我从上面的代码开始,并且前两个打印语句的输出是:
~ 0 0 0 0 0
level page_num block_num par_num line_num word_num left top width height conf text
1 1 0 0 0 0 0 0 1027 742 -1
2 1 1 0 0 0 0 0 0 742 -1
3 1 1 1 0 0 0 0 0 742 -1
4 1 1 1 1 0 0 0 0 742 -1
5 1 1 1 1 1 0 0 0 742 95
第三个print语句不提供输出,或者输出为空。 如果我在某个地方出错了,我会感到困惑吗?这是使用OCR从图像中提取文本的正确方法吗?