如何使用java获取pdf的行数

时间:2015-06-02 08:47:04

标签: java pdf itext

我需要使用java获取pdf文件中的行数。

我使用itext-2.1.7.jar来获取页数。

有没有办法获得pdf中的行数。

1 个答案:

答案 0 :(得分:1)

没有简单的方法可以做到这一点,只有aproximations。问题是pdf页面是一个画布,在任意位置都有图纸,其中一些恰好是字体和文本。

一种方法是提取文本,并从文本位置构建一个您将考虑行的列表。使用LocationTextExtractionStrategy得到这个结果,但你必须使用更新的jar,itext 2.1.7太旧了,并且在文本提取方面效果不好。