Question

我希望我的程序从图像中读取/，_和\，但有时它会将/读为I和{{1} }设为/_\。我正在使用pytesseract库来执行此操作。有没有办法专门读取诸如A和/_之类的字符？

Answer 1

您可以使用pytesseract.image_to_string从图像中读取文本。根据您的图像，可能需要先进行预处理，然后再将其放入Pytesseract。这可以是使用morphological operations的阈值化，模糊化或平滑化技术的组合。使用此示例图片，

这是打印到控制台的结果

我们使用--psm 6配置标志，因为我们希望将图像视为单个统一的文本块。这是一些可能有用的其他configuration flags

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = cv2.imread('1.png',0)
data = pytesseract.image_to_string(image, lang='eng',config='--psm 6')
print('Result:', data)

如何从图像中读取标点符号，例如“ /”，“ _”和“ \”

1 个答案: