利用低分辨率图像提高单字符识别的准确性

时间:2019-08-20 11:21:54

标签: tesseract python-tesseract

我有一组相同大小的图像,其中包含一个字符,每次图像的位置大致相同。这些图像均为80x75像素,具有纯白色背景和纯黑色字符。

以下是我的图片的一些示例: https://imgur.com/a/yiFajwZ

到目前为止,使用这种配置(单字符模式和字符白名单)的准确性非常差:

pytesseract.image_to_string(x, config="-c tessedit
_char_whitelist=abcdefghijklmnopqrstuvwxyz
--psm 10
-l osd
")

任何帮助都会很棒,谢谢。

编辑:我尝试将图像调整为更大的尺寸,例如800 x 750,但仍然存在相同的问题。这些字符被认为是:

  • c-> p
  • f-> l
  • j-> l
  • k-> g
  • t-> l
  • v-> y
  • x-> m
  • y-> y

0 个答案:

没有答案