pytesseract image_to_string函数的无关输出

时间:2020-07-03 18:41:48

标签: opencv deep-learning computer-vision tesseract cv2

我正在尝试从图像中提取文本,但是pytesseract提供了完全不同的输出,输出下方附加的图像是“ Werle”(完整的单词和字符),我尝试了许多不同的处理方法,例如图像增强,rgb2gray ,rgb2binary仍然无法正常工作。令我感到困惑的是,图像中的文字非常清晰直接。我还尝试将笔记本从google colab更改为我的本地笔记本,并检查了库版本,但结果相同。

enter image description here

输出>>“ Werle”

这是我的代码:-

ret,frame = cap.read()
crop_img = frame[320:400,430:840]
text = pt.image_to_string(crop_img)

注意:此问题发生在样式相同但单词不同的其他图像上

1 个答案:

答案 0 :(得分:0)

事实证明,Pytesseract是在具有白色背景和黑色文本的数据上进行训练的,所以我所做的就是将黑色像素变成白色,将白色像素变成黑色

file:///C:/Users/m3/repos/doxygen-output/html/index.html

,并且在此预处理中正常工作。