Question

我正在尝试从图像中提取文本，但是pytesseract提供了完全不同的输出，输出下方附加的图像是“ Werle”（完整的单词和字符），我尝试了许多不同的处理方法，例如图像增强，rgb2gray ，rgb2binary仍然无法正常工作。令我感到困惑的是，图像中的文字非常清晰直接。我还尝试将笔记本从google colab更改为我的本地笔记本，并检查了库版本，但结果相同。

输出>>“ Werle”

这是我的代码：-

ret,frame = cap.read()
crop_img = frame[320:400,430:840]
text = pt.image_to_string(crop_img)

注意：此问题发生在样式相同但单词不同的其他图像上

Answer 1

事实证明，Pytesseract是在具有白色背景和黑色文本的数据上进行训练的，所以我所做的就是将黑色像素变成白色，将白色像素变成黑色

file:///C:/Users/m3/repos/doxygen-output/html/index.html

，并且在此预处理中正常工作。

pytesseract image_to_string函数的无关输出

1 个答案: