Tess4j api无法准确读取pdf文件

时间:2016-02-18 14:46:39

标签: java pdf ocr tesseract tess4j

我准备用java中的tess4j读取pdf文件,它工作得很好但不幸的是在我的pdf中,每个都是表格格式,tess4j读取所有行,除了以下两行货币ZAR和金额4.00 ,我不知道是什么原因。下面是我缺少CURRENCY和AMOUNT行的表。

VALUE DATE(DDMMYY)21-Dec-14

CURRENCY ZAR

AMOUNT 1.88

订购机构NEDBANK LIMITED                         NEDSZAJJ

中间汇丰银行                         HSBCBB22

评论RBCD

你可以帮我解决这个问题吗

您可以在此处找到示例PDF MT210_changed_123.pdf

0 个答案:

没有答案