从PDF中提取标签

时间:2011-08-29 12:53:51

标签: pdf tags

有人可以推荐一个库(Linux二进制文件,jar或源代码)从标记的PDF文件中提取标记树吗?我试过PDFMiner,但它在我试过的第一个文件上崩溃了

1 个答案:

答案 0 :(得分:1)

您是否尝试使用iText?请查看PDFVole以获取使用iText直观显示此树的项目示例。您将无法使用此appoach将树节点与其相应的页面内容链接起来。