使用Java从PDF文件中提取大纲(或书签)

时间:2010-08-11 20:12:42

标签: java pdf text extract

我正在使用PDFBox从PDF文件中提取大纲(书签)信息,甚至在同一网站中进行了解释。

但是,我遇到的问题是没有提取,而是生成合格的网址(foo.pdf#page=22777&zoom=2,2,777)以在这些书签中打开PDF。有时PDFBox无法找到放置书签的页面(即页码,左坐标或顶部坐标错误。)

任何人都知道能够执行此操作的PDF库(最好是Java)?感谢。

致以最诚挚的问候,

亚历山大。

1 个答案:

答案 0 :(得分:1)

iText(http://itextpdf.com)可能适合您。

我主要使用它来创建PDF(与解析已经存在的内容不同),但是库很好,并且确实有与轮廓和书签相关的对象。