标签: ocr tesseract
我正在尝试使用Tesseract在某些图像上查找文本,但是在处理该图像时遇到了问题:
文字为葡萄牙语,尽管清楚写成Imagem,但Tesseract只给了我ot。
Imagem
ot
我正在使用的命令是tesseract tmp.jpg out --psm 7 -l por,并且我尝试了--psm参数的顺利运行。
tesseract tmp.jpg out --psm 7 -l por
--psm
我缺少可以提高识别度的东西吗?
答案 0 :(得分:2)
Tesseract尝试根据图像中的黑色像素来猜测字体大小,因此最好在白色背景上使用黑色文本。