应用错误收集

我正在使用Tesseract版本='v5.0.0.20190526'。我正在从中提取文本。使用

pytesseract.image_to_data(img, output_type=Output.DICT)

由于默认的psm模式，它以垂直方式读取图像，但是正确读取了所有字符。

但是当我添加psm时。

d = pytesseract.image_to_data(img, output_type=Output.DICT,config='--psm 6')

它正在按水平方向读取图像，但是现在它读取了很多错误的字符，例如“ Note”，“ 2017”和其下方的货币符号

这可能是什么问题？