Tesseract在图像处理后没有识别任何东西

时间:2014-05-17 17:48:58

标签: image image-processing ocr tesseract

这是我处理之前的图像:

original

处理后,它看起来像是:

modified

我认为第二个很棒,但看起来我错了。当我在原始图像上使用tesseract时,它识别出文本的部分。但是当我在第二个(黑色和白色)上做它时,它根本不识别任何东西!这是为什么?我在这里做错了什么?

1 个答案:

答案 0 :(得分:3)

  1. 我对你的照片进行了一些测试。我认为主要问题是图像质量差。尝试更高分辨率的图像,可以更好地工作。
  2. 我假设你只想要项目名称?如果是,则删除"立即购买:"和硬币+相应的数字也(就像其他人一样把它们漆成黑色),这对我来说更好!
  3. 还可以使用Tesseract的不同设置,我认为psm 1和6的效果最好。
  4. 结论:更高的图像质量(分辨率)应该是最好的!