应用错误收集

时间：2010-10-02 00:13:27

标签： iphone tesseract

我在我的一个应用程序中使用Tesseract，但我无法获得完美的结果。当我在完美的屏幕截图上使用该库时，它可以获得大部分文本，这很好。但是当我在照片上使用它时，它无法解决问题，有时它甚至不会返回任何东西。

我知道你可以训练Tesseract，有没有一个很好的训练教程或iPhone照片识别的东西？或者在处理之前我应该对源图像进行任何修改吗？

谢谢！

答案 0 :(得分：2)

发布样本图片。以下是一些要注意的事项：

如何将图像转换为1位？最终OCR是用黑白图像完成的 - 也许你可以比图书馆做得更好。

图像的DPI是多少？扫描通常约为200-300 DPI，但照片可以是72或96. OCR引擎会查看DPI以了解字母的大小。您可能需要更改DPI并重新采样（调整大小）图像，以使DPI符合预期。 OCR引擎期待扫描文档，而不是照片。