应用错误收集

时间：2017-08-08 04:26:02

标签： tesseract google-cloud-vision

我已在我的Java应用程序中集成了Google Cloud Vision API，以便从复杂的格式化文档中识别文本。我的一位同事建议使用＆＃34; Tesseract API＆＃34;。任何人都可以在这两个API之间给出差异。这在准确性方面要好一些，或者比其他更好.TIA

答案 0 :(得分：6)

Tesseract是开源的，免费的，可以在本地运行。但它还需要培训和调整，一般来说，它的识别率比Google，Microsoft和OCR.space的云ocr服务更差。但最好是使用我们自己的图像在线测试：

答案 1 :(得分：1)

我都用过它们。 Google Vision比Tesseract快得多，如果再过一年，那么准确性也更高。

Tesseract最近采用了首选的语言选择和经过训练的数据，使LSTM适应了需求，经过优化的数据可以使速度提高大约2倍甚至更多。但可以肯定的是，除非他们开始支持CUDA，否则它不会比Google愿景快。

关于准确性，我已经用最佳和最差的文档图像对它们进行了测试，并且Google Vision的准确性达到了66.6％，Tesseract达到了82％，这对我来说已经足够了。

如果您喜欢准确性，那么Tesseract是赢家，如果您喜欢时间，那么Google Vision是最佳选择。

此外，还有几个其他受CUDA支持的项目可能会比它们更好。

答案 2 :(得分：0)

Google Vision OCR是付费的，它比tesseract更好，而tesseract是完全免费的开源项目。

您可以阅读以下内容以了解不同之处：