我正在尝试制作相机活动,以便将照片拍摄为OCR。这就是我希望实现的目标:
我正在使用tesseract btw。
如果有人愿意给我一些参考/示例/教程,那就太棒了。
答案 0 :(得分:3)
这里有一个取景器矩形:
答案 1 :(得分:1)
我一直在做类似的事情。现在,我只是将整张照片发送到网络服务并使用OCRfeeder进行处理,这将对图像执行分段并将每个部分中的文本发送到tesseract。我一直在以这种方式获得更好的准确性。此外,您可能希望执行some preprocessing to clean up the image first.
答案 2 :(得分:0)
可以有两种一般方法。
您可以在将图像发送到OCR引擎之前调整图像大小。请记住,您使用的Tesseract引擎具有某种功能 - 它需要在字符和图像边框之间留出一些空间,有时会超出预期。
第二种方法是使用字段级识别,指定文本块的坐标并将完整图像发送到OCR引擎。看看http://www.ocrsdk.com,它是最近由ABBYY推出的带有web api的云OCR SDK,它处于测试阶段,所以现在它可以免费使用。它有一个field level recognition methods和Android code samples。我工作@ ABBYY,如有必要可以提供有关我们产品的其他信息