我正在使用Google Drive的API从PDF文件中提取文本。有谁知道用于此的工具是否是tessaract?在我开始使用它之前,我想知道后端是什么。
我所指的电话可以在OCR下找到on their API page。
感谢您的帮助!
答案 0 :(得分:0)
如果您查看Google Drive文档及此Google Drive Blog about OCR,Google就没有提及他们使用Tesseract。但是,如果您查看Tesseract information,则说明Tesseract开发自2006年以来一直由Google赞助。很抱歉,但我认为只有知道此OCR的Google员工才能回答或验证您的问题。希望这条信息可以帮到你。
答案 1 :(得分:0)
根据2015年的这个Online OCR Software Review,来自Google OCR的转换准确性要比Tesseract好得多,因此他们仍然不太可能在后端使用Tesseract。
我的猜测是他们同时使用自己的OCR云服务:https://cloud.google.com/vision/