当OCR复选框(不是表格)时,我从Tesseract得到什么?

时间:2018-02-22 17:00:47

标签: tesseract

我们解析了许多供应商提供的大量PDF文件。 PDF类似,但不完全相同,并且在同一页面上的内容并不总是完全相同。在某些情况下,我们可以通过从PDF获取字符串来解析,复选框是Unicode。但是,许多供应商都没有使用Unicode这样的图像。这些永远不是形式。因此,如果我使用iText对整个文档进行OCR,它会为这些复选框生成什么?这样我可以查找并查看是否选中了复选框?或者我只是运气不好,数据进入我们的应用程序的唯一方法是通过手动输入?感谢。

0 个答案:

没有答案