我正在使用Tesseract版本='v5.0.0.20190526'。我正在从中提取文本。使用
pytesseract.image_to_data(img, output_type=Output.DICT)
由于默认的psm模式,它以垂直方式读取图像,但是正确读取了所有字符。
但是当我添加psm时。
d = pytesseract.image_to_data(img, output_type=Output.DICT,config='--psm 6')
它正在按水平方向读取图像,但是现在它读取了很多错误的字符,例如“ Note”,“ 2017”和其下方的货币符号
这可能是什么问题?