android - 创建优化/适合OCR的相机活动

创建优化/适合OCR的相机活动

时间：2012-01-27 15:04:01

标签： android ocr android-camera tesseract

我正在尝试制作相机活动，以便将照片拍摄为OCR。这就是我希望实现的目标：

相机预览中间的可调整大小的框，用于指示将在Bitmap中创建哪个特定区域并由OCR引擎处理。
连续自动对焦（完成）

我正在使用tesseract btw。

如果有人愿意给我一些参考/示例/教程，那就太棒了。

3 个答案:

答案 0 :(得分：3)

这里有一个取景器矩形：

https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

答案 1 :(得分：1)

我一直在做类似的事情。现在，我只是将整张照片发送到网络服务并使用OCRfeeder进行处理，这将对图像执行分段并将每个部分中的文本发送到tesseract。我一直在以这种方式获得更好的准确性。此外，您可能希望执行some preprocessing to clean up the image first.

答案 2 :(得分：0)

可以有两种一般方法。

您可以在将图像发送到OCR引擎之前调整图像大小。请记住，您使用的Tesseract引擎具有某种功能 - 它需要在字符和图像边框之间留出一些空间，有时会超出预期。

第二种方法是使用字段级识别，指定文本块的坐标并将完整图像发送到OCR引擎。看看http://www.ocrsdk.com，它是最近由ABBYY推出的带有web api的云OCR SDK，它处于测试阶段，所以现在它可以免费使用。它有一个field level recognition methods和Android code samples。我工作@ ABBYY，如有必要可以提供有关我们产品的其他信息