如果我更改psm模式,Tesseract读取的字符错误

时间:2019-06-16 04:50:10

标签: python tesseract

我正在使用Tesseract版本='v5.0.0.20190526'。我正在从image中提取文本。使用

pytesseract.image_to_data(img, output_type=Output.DICT)

由于默认的psm模式,它以垂直方式读取图像,但是正确读取了所有字符。

但是当我添加psm时。

d = pytesseract.image_to_data(img, output_type=Output.DICT,config='--psm 6')

它正在按水平方向读取图像,但是现在它读取了很多错误的字符,例如“ Note”,“ 2017”和其下方的货币符号

这可能是什么问题?

0 个答案:

没有答案