我正在使用tesseract对文档中的识别文本和数字进行一些OCR。我使用pytesseract作为我的python包装器。
首先,我只是使用image_to_string来查看我的关键字是否位于我的文档中。一旦找到,我会使用image_to_data在文档中找到这些关键字。
这就是问题所在。我能够使用image_to_string找到关键字但是当我使用image_to_data转换相同的输入文档时,我无法在详细数据中找到关键字。
这是一个错误还是测试OCR的行为方式。任何帮助将不胜感激。