应用错误收集

在Google上使用Google Docs OCR进行其他操作

时间：2011-04-28 01:26:26

标签： android ocr

我正在考虑使用我的Android手机从文档中捕获一些文本，并在Android上寻找理想的OCR应用程序。我刚刚读到谷歌介绍了OCR用于扫描可以在Google Docs中编辑的文档。我想知道我是否可以将OCR用于除了将文档转换为Google Docs之外的其他内容 - 例如，拍摄证书照片并获取候选人的姓名和出生日期，或拍摄车牌照片能够将信息作为可存储的文本获取。

如果有人知道如何使用Google的OCR在Android上实现这一点，那就太棒了。我确实读过有关Tesseract / Tesjeract的内容，但似乎很难实现我想要的东西 - 也许我还没有完全理解如何通过Java使用它。以下是使用OCR扫描文档的新应用程序的链接 - Google Docs on Android

2 个答案:

答案 0 :(得分：0)

我们之前尝试过Google Docs API，但在准确性方面却非常弱。看起来它是基于一些过时版本的tesseract。我想如果你尝试tesseract你会得到更多的准确性。但是，您需要管理相机拍摄的图像的特殊预处理，因为它们会带来额外的挑战。 Google Docs API没有。

在Android上运行Tesseract时，请看： Using tesseract on android

手机上OCR的tesseract的替代品： http://www.abbyy.com/mobileocr/

但是，如果您不仅要捕获文本，还要查看数据，那么您可能需要其他技术来解析文本输出。这意味着要编写更多代码。或者，可以选择从ABBYY许可现有的纪律数据捕获API。这已经在这里讨论了：

Recognise text in certain position using the Iphone camera

免责声明：我为ABBYY工作

答案 1 :(得分：-1)

您可以使用Google文档（现在称为Google云端硬盘）通过将图像上传到Google云端硬盘来对图像进行OCR。稍后您可以将此Google文档作为text / rtf / doc / html文件提取。现在这个数据 - 您可以在应用中使用。这可以使用Google Drive API直接实现，无需用户干预。以下是一些Google App API参考：

使用OCR上传：参见
Fail to upload a image file into Google Doc via java api与？convert = true
要从Google云端硬盘下载文件： https://developers.google.com/google-apps/documents-list/#downloading_documents_and_files https://docs.google.com/feeds/download/documents/Export?docID=__INSERT-ID__&exportFormat=txt&format=txt

请注意应该有一个配额来使用OCR服务。