我从pytesseract得到的输出是1 l_4§ll
我的理想输出是1'-4 1/8"
请注意,这适用于按顺序放置小数的文本图像,例如,即使您裁剪了理想输出的图像,即使有时将引号弄乱并用短划线也可以,但这是我能够使用的。
我如何让pytesseract处理这种分数图像?
我在python中用于读取图像文本的代码:
from PIL import Image
import pytesseract
import cv2
def get_text_from_file(img_path):
#load image
image = cv2.imread(img_path)
text = get_text_from_image(image)
return text
def get_text_from_image(image):
text = pytesseract.image_to_string(image)
return text