我需要使用java获取pdf文件中的行数。
我使用itext-2.1.7.jar
来获取页数。
有没有办法获得pdf中的行数。
答案 0 :(得分:1)
没有简单的方法可以做到这一点,只有aproximations。问题是pdf页面是一个画布,在任意位置都有图纸,其中一些恰好是字体和文本。
一种方法是提取文本,并从文本位置构建一个您将考虑行的列表。使用LocationTextExtractionStrategy
得到这个结果,但你必须使用更新的jar,itext 2.1.7太旧了,并且在文本提取方面效果不好。