我正在使用Google Cloud Vision API来检测收据中的文字。在某些情况下,并未检测到收据上的所有文本。主要是短数字,符号和单词未被检测到。
可以找到此问题的一个示例here,这是荷兰收据,使用"试用API"接口。如图所示,并未检测到所有文本。
图像符合文档中设置的最佳做法指南。
有没有办法改善图像或配置API以便检测所有文本和符号?任何提示或帮助都非常感谢。
答案 0 :(得分:0)
这是Google OCR的缺点之一-它经常丢失单个字符和符号。如果使用检测模式“ TEXT_DETECTION”而不是“ DOCUMENT_TEXT_DETECTION”,则可能会得到更多的单个字母和符号。但是不能保证检测到所有单个字母。
顺便说一句:ABBYY云OCR-API这样做更好-但要贵得多。