如何从图像中读取标点符号,例如“ /”,“ _”和“ \”

时间:2019-09-05 00:53:24

标签: python image opencv image-processing python-tesseract

我希望我的程序从图像中读取/_\,但有时它会将/读为I和{{1} }设为/_\。我正在使用pytesseract库来执行此操作。 有没有办法专门读取诸如A/_之类的字符?

1 个答案:

答案 0 :(得分:0)

您可以使用pytesseract.image_to_string从图像中读取文本。根据您的图像,可能需要先进行预处理,然后再将其放入Pytesseract。这可以是使用morphological operations的阈值化,模糊化或平滑化技术的组合。使用此示例图片,

enter image description here

这是打印到控制台的结果

enter image description here

我们使用--psm 6配置标志,因为我们希望将图像视为单个统一的文本块。这是一些可能有用的其他configuration flags

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = cv2.imread('1.png',0)
data = pytesseract.image_to_string(image, lang='eng',config='--psm 6')
print('Result:', data)