IText无法使用Java从PDF的表格数据中读取空格

时间:2018-03-28 05:55:14

标签: java itext

这个问题已经被问到,但我的查询没有得到解答。我有一个表格的pdf,其中一些列没有任何值。我需要阅读那些空白区域。 我已经使用Itext pdf从pdf中提取数据,但是从表中读取数据时,它是逐列读取的,没有值的列不是用空格读取,而是读取下一列。 我已经定制了LocationTextExtractionStrategy并重写了getResultantText() 在下面的图像中,如果没有MD和TD col 1,2,3的值,那么在1之后读取PDF时它不会给我空格但是给出下一个值为2.是否有任何解决方案来读取空白空间

PdfReader reader = new PdfReader(filename);

FontRenderFilter fontFilter = new FontRenderFilter();

TextExtractionStrategy strategy = new FilteredTextRenderListener(new MyLocationTextExtractionStrategy(),fontFilter);
    for (int i = 1; i <= reader.getNumberOfPages(); i++) {
        String finalText = PdfTextExtractor.getTextFromPage(reader, i, strategy);

        System.out.println("finalText.." + finalText);
    }

pdf table to be exttracted

0 个答案:

没有答案