我得到了Tesseract无法读取的简单数学表达式的图像:
我已经测试了用Android手机编写的相同表情的屏幕截图,并且阅读效果非常好。所以我认为这是一个字体问题。 我考虑过:
答案 0 :(得分:0)
但是当我输入问题时,我环顾四周。
this answer提示我使用此VietOCR软件仔细检查自己的理智,该软件输出8-3
,足够接近!
然后我弄乱了软件,发现我可以将--psm 7
(Page Segmentation Mode 7: Treat the image as a single text line)
传递给脚本,该脚本非常适合我的数学表达式:
pytesseract.image_to_string(img, config='--psm 7')