应用错误收集

Tesseract无法识别明文

时间：2018-12-06 18:47:02

标签： ocr tesseract

我正在尝试使用Tesseract在某些图像上查找文本，但是在处理该图像时遇到了问题：

文字为葡萄牙语，尽管清楚写成Imagem，但Tesseract只给了我ot。

我正在使用的命令是tesseract tmp.jpg out --psm 7 -l por，并且我尝试了--psm参数的顺利运行。

我缺少可以提高识别度的东西吗？

1 个答案:

答案 0 :(得分：2)

Tesseract尝试根据图像中的黑色像素来猜测字体大小，因此最好在白色背景上使用黑色文本。