我希望我的程序从图像中读取/
,_
和\
,但有时它会将/
读为I
和{{1} }设为/_\
。我正在使用pytesseract库来执行此操作。
有没有办法专门读取诸如A
和/_
之类的字符?
答案 0 :(得分:0)
您可以使用pytesseract.image_to_string
从图像中读取文本。根据您的图像,可能需要先进行预处理,然后再将其放入Pytesseract。这可以是使用morphological operations的阈值化,模糊化或平滑化技术的组合。使用此示例图片,
这是打印到控制台的结果
我们使用--psm 6
配置标志,因为我们希望将图像视为单个统一的文本块。这是一些可能有用的其他configuration flags
import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
image = cv2.imread('1.png',0)
data = pytesseract.image_to_string(image, lang='eng',config='--psm 6')
print('Result:', data)