我已在我的Java应用程序中集成了Google Cloud Vision API,以便从复杂的格式化文档中识别文本。我的一位同事建议使用" Tesseract API"。任何人都可以在这两个API之间给出差异。这在准确性方面要好一些,或者比其他更好.TIA
答案 0 :(得分:6)
Tesseract是开源的,免费的,可以在本地运行。 但它还需要培训和调整,一般来说,它的识别率比Google,Microsoft和OCR.space的云ocr服务更差。但最好是使用我们自己的图像在线测试:
NewOCR(在线ocr由Tesseract提供支持)
答案 1 :(得分:1)
我都用过它们。 Google Vision比Tesseract快得多,如果再过一年,那么准确性也更高。
Tesseract最近采用了首选的语言选择和经过训练的数据,使LSTM适应了需求,经过优化的数据可以使速度提高大约2倍甚至更多。但可以肯定的是,除非他们开始支持CUDA,否则它不会比Google愿景快。
关于准确性,我已经用最佳和最差的文档图像对它们进行了测试,并且Google Vision的准确性达到了66.6%,Tesseract达到了82%,这对我来说已经足够了。
如果您喜欢准确性,那么Tesseract是赢家,如果您喜欢时间,那么Google Vision是最佳选择。
此外,还有几个其他受CUDA支持的项目可能会比它们更好。
答案 2 :(得分:0)
Google Vision OCR是付费的,它比tesseract更好,而tesseract是完全免费的开源项目。
您可以阅读以下内容以了解不同之处:
2。https://dataturks.com/blog/compare-image-text-recognition-apis.php