谷歌ocr api for android(图像到文本转换)

时间:2013-04-07 10:01:08

标签: java android tesseract

我尝试通过tesseract这样做,但生成的apk文件是8 MB。 我在Play中看过Goggles应用程序并且效率很高。 我想知道如何整合这种技术。我没有在任何教程中看到过。 如果有人知道该怎么做,请回复。

另外,我如何提高我使用的Tesseract的质量。 转换是顺利的但我想知道如果我将图像分成几个部分然后单独解析,那么它是否有用。

要求是它应该阅读账单或收据,所以我想提高文本转换的质量。 请建议。

1 个答案:

答案 0 :(得分:2)

我相信你编译这个项目:tess-two。我是对的吗?

如果是这样,您可以通过针对特定CPU架构编译不同的APK来大大减小APK的大小。此外,您可以删除大部分Leptonica的功能,因为您不需要它们。

为了更好的准确性:

  • 如果您使用手机的相机作为输入,则应更改二值化算法。 Leptonica有一些二值化算法,试试Sauvola。
  • 调整tesseract的参数以获得更好的性能与速度。
  • 确保所有手机都具有一致的分辨率。大约300dpi的地方。

如果您想在大多数手机上快速运行小型应用程序,请考虑在服务器上运行OCR,而不是在手机上运行。

据我所知,Tesseract是迄今为止可以为Android编译的最佳OCR引擎。它必须正确调整并提供良好的图像。