Tesseract无法识别明文

时间:2018-12-06 18:47:02

标签: ocr tesseract

我正在尝试使用Tesseract在某些图像上查找文本,但是在处理该图像时遇到了问题:

Imagem

文字为葡萄牙语,尽管清楚写成Imagem,但Tesseract只给了我ot

我正在使用的命令是tesseract tmp.jpg out --psm 7 -l por,并且我尝试了--psm参数的顺利运行。

我缺少可以提高识别度的东西吗?

1 个答案:

答案 0 :(得分:2)

Tesseract尝试根据图像中的黑色像素来猜测字体大小,因此最好在白色背景上使用黑色文本。