我正在考虑使用我的Android手机从文档中捕获一些文本,并在Android上寻找理想的OCR应用程序。我刚刚读到谷歌介绍了OCR用于扫描可以在Google Docs中编辑的文档。我想知道我是否可以将OCR用于除了将文档转换为Google Docs之外的其他内容 - 例如,拍摄证书照片并获取候选人的姓名和出生日期,或拍摄车牌照片能够将信息作为可存储的文本获取。
如果有人知道如何使用Google的OCR在Android上实现这一点,那就太棒了。我确实读过有关Tesseract / Tesjeract的内容,但似乎很难实现我想要的东西 - 也许我还没有完全理解如何通过Java使用它。以下是使用OCR扫描文档的新应用程序的链接 - Google Docs on Android
答案 0 :(得分:0)
我们之前尝试过Google Docs API,但在准确性方面却非常弱。看起来它是基于一些过时版本的tesseract。我想如果你尝试tesseract你会得到更多的准确性。但是,您需要管理相机拍摄的图像的特殊预处理,因为它们会带来额外的挑战。 Google Docs API没有。
在Android上运行Tesseract时,请看: Using tesseract on android
手机上OCR的tesseract的替代品: http://www.abbyy.com/mobileocr/
但是,如果您不仅要捕获文本,还要查看数据,那么您可能需要其他技术来解析文本输出。这意味着要编写更多代码。或者,可以选择从ABBYY许可现有的纪律数据捕获API。这已经在这里讨论了:
Recognise text in certain position using the Iphone camera
免责声明:我为ABBYY工作
答案 1 :(得分:-1)
您可以使用Google文档(现在称为Google云端硬盘)通过将图像上传到Google云端硬盘来对图像进行OCR。稍后您可以将此Google文档作为text / rtf / doc / html文件提取。现在这个数据 - 您可以在应用中使用。这可以使用Google Drive API直接实现,无需用户干预。以下是一些Google App API参考:
使用OCR上传:参见
Fail to upload a image file into Google Doc via java api与?convert = true
要从Google云端硬盘下载文件:
https://developers.google.com/google-apps/documents-list/#downloading_documents_and_files
https://docs.google.com/feeds/download/documents/Export?docID=__INSERT-ID__&exportFormat=txt&format=txt
请注意应该有一个配额来使用OCR服务。