Google Cloud Vision OCR API是否具有比Tesseract OCR API更高的准确性和性能

时间:2017-08-08 04:26:02

标签: tesseract google-cloud-vision

我已在我的Java应用程序中集成了Google Cloud Vision API,以便从复杂的格式化文档中识别文本。我的一位同事建议使用" Tesseract API"。任何人都可以在这两个API之间给出差异。这在准确性方面要好一些,或者比其他更好.TIA

3 个答案:

答案 0 :(得分:6)

Tesseract是开源的,免费的,可以在本地运行。 它还需要培训和调整,一般来说,它的识别率比Google,Microsoft和OCR.space的云ocr服务更差。但最好是使用我们自己的图像在线测试:

答案 1 :(得分:1)

我都用过它们。 Google Vision比Tesseract快得多,如果再过一年,那么准确性也更高。

Tesseract最近采用了首选的语言选择和经过训练的数据,使LSTM适应了需求,经过优化的数据可以使速度提高大约2倍甚至更多。但可以肯定的是,除非他们开始支持CUDA,否则它不会比Google愿景快。

关于准确性,我已经用最佳和最差的文档图像对它们进行了测试,并且Google Vision的准确性达到了66.6%,Tesseract达到了82%,这对我来说已经足够了。

如果您喜欢准确性,那么Tesseract是赢家,如果您喜欢时间,那么Google Vision是最佳选择。

此外,还有几个其他受CUDA支持的项目可能会比它们更好。

答案 2 :(得分:0)

Google Vision OCR是付费的,它比tesseract更好,而tesseract是完全免费的开源项目。

您可以阅读以下内容以了解不同之处:

1。https://www.reddit.com/r/computervision/comments/74qcqv/tesseract_or_google_vision_api_for_image_ocr/

2。https://dataturks.com/blog/compare-image-text-recognition-apis.php