我有一组相同大小的图像,其中包含一个字符,每次图像的位置大致相同。这些图像均为80x75像素,具有纯白色背景和纯黑色字符。
以下是我的图片的一些示例: https://imgur.com/a/yiFajwZ
到目前为止,使用这种配置(单字符模式和字符白名单)的准确性非常差:
pytesseract.image_to_string(x, config="-c tessedit
_char_whitelist=abcdefghijklmnopqrstuvwxyz
--psm 10
-l osd
")
任何帮助都会很棒,谢谢。
编辑:我尝试将图像调整为更大的尺寸,例如800 x 750,但仍然存在相同的问题。这些字符被认为是: