应用错误收集

我们解析了许多供应商提供的大量PDF文件。 PDF类似，但不完全相同，并且在同一页面上的内容并不总是完全相同。在某些情况下，我们可以通过从PDF获取字符串来解析，复选框是Unicode。但是，许多供应商都没有使用Unicode这样的图像。这些永远不是形式。因此，如果我使用iText对整个文档进行OCR，它会为这些复选框生成什么？这样我可以查找并查看是否选中了复选框？或者我只是运气不好，数据进入我们的应用程序的唯一方法是通过手动输入？感谢。

当OCR复选框（不是表格）时，我从Tesseract得到什么？

0 个答案: