Tesseract无法读取数学表达式

时间:2019-03-25 19:08:33

标签: python python-imaging-library tesseract

我得到了Tesseract无法读取的简单数学表达式的图像:

8 - 3 = 5

我已经测试了用Android手机编写的相同表情的屏幕截图,并且阅读效果非常好。所以我认为这是一个字体问题。 我考虑过:

1 个答案:

答案 0 :(得分:0)

但是当我输入问题时,我环顾四周。

this answer提示我使用此VietOCR软件仔细检查自己的理智,该软件输出8-3,足够接近!

然后我弄乱了软件,发现我可以将--psm 7 (Page Segmentation Mode 7: Treat the image as a single text line)传递给脚本,该脚本非常适合我的数学表达式:

pytesseract.image_to_string(img, config='--psm 7')

List of PSMs