perl,从PDF文件中提取TOC

时间:2015-01-21 18:25:04

标签: perl pdf tableofcontents

我已经通过CAM :: PDF和其他PDF相关模块进行了检查,但无法确定是否有办法从清晰的PDF文件中提取内容表。

如果有任何想法,我将不胜感激!

1 个答案:

答案 0 :(得分:2)

我无法找到一个支持提取pdf书签的库(我认为你的意思是目录)。

但是,pdftk在这方面做得很好,可以从命令行运行;

pdftk myfile.pdf dump_data | grep BookmarkTitle > outline.txt