我正在尝试从图像中提取文本,但是pytesseract提供了完全不同的输出,输出下方附加的图像是“ Werle”(完整的单词和字符),我尝试了许多不同的处理方法,例如图像增强,rgb2gray ,rgb2binary仍然无法正常工作。令我感到困惑的是,图像中的文字非常清晰直接。我还尝试将笔记本从google colab更改为我的本地笔记本,并检查了库版本,但结果相同。
输出>>“ Werle”
这是我的代码:-
ret,frame = cap.read()
crop_img = frame[320:400,430:840]
text = pt.image_to_string(crop_img)
注意:此问题发生在样式相同但单词不同的其他图像上
答案 0 :(得分:0)
事实证明,Pytesseract是在具有白色背景和黑色文本的数据上进行训练的,所以我所做的就是将黑色像素变成白色,将白色像素变成黑色
file:///C:/Users/m3/repos/doxygen-output/html/index.html
,并且在此预处理中正常工作。