标签: perl pdf tableofcontents
我已经通过CAM :: PDF和其他PDF相关模块进行了检查,但无法确定是否有办法从清晰的PDF文件中提取内容表。
如果有任何想法,我将不胜感激!
答案 0 :(得分:2)
我无法找到一个支持提取pdf书签的库(我认为你的意思是目录)。
但是,pdftk在这方面做得很好,可以从命令行运行;
pdftk myfile.pdf dump_data | grep BookmarkTitle > outline.txt