我在我的一个应用程序中使用Tesseract,但我无法获得完美的结果。当我在完美的屏幕截图上使用该库时,它可以获得大部分文本,这很好。但是当我在照片上使用它时,它无法解决问题,有时它甚至不会返回任何东西。
我知道你可以训练Tesseract,有没有一个很好的训练教程或iPhone照片识别的东西?或者在处理之前我应该对源图像进行任何修改吗?
谢谢!
答案 0 :(得分:2)
发布样本图片。以下是一些要注意的事项:
如何将图像转换为1位?最终OCR是用黑白图像完成的 - 也许你可以比图书馆做得更好。
图像的DPI是多少?扫描通常约为200-300 DPI,但照片可以是72或96. OCR引擎会查看DPI以了解字母的大小。您可能需要更改DPI并重新采样(调整大小)图像,以使DPI符合预期。 OCR引擎期待扫描文档,而不是照片。