如何从PDF文件中提取页面?

时间:2009-01-06 14:59:08

标签: perl pdf

是否有任何Perl脚本从PDF文件中获取页面并将其转换为另一个PDF文件?

7 个答案:

答案 0 :(得分:5)

PdfTK

~$ pdftk multi-page.pdf burst

答案 1 :(得分:4)

你问过Perl,所以通过CAM::PDF这是一个很好的解决方案。假设您只想将orig.pdf的第3-6页保存到new.pdf:

deletepdfpage.pl orig.pdf 1-2,7- new.pdf

答案 2 :(得分:3)

由于 gnud 已经回答,pdftk是这项工作的最佳工具。例如,要将第5-10页从 test.pdf 提取到 out.pdf ,您可以写:

pdftk test.pdf cat 5-10 output out.pdf

答案 3 :(得分:2)

在OS X上,您可以在预览中执行此操作,方法是在缩略图视图中拖动页面。

答案 4 :(得分:1)

安德烈亚斯给出的代码对我不起作用。如果使用Pdftk,在Windows上这个公式适用于我:

pdftk source.pdf cat 123-128 output out.pdf dont_ask

来源显然是源pdf,123-128提取页面的intervall和out.pdf新pdf。

答案 5 :(得分:1)

我相信实际代码......此代码可能对您有用:

使用CAM :: PDF;

my $ file_name =“abc.pdf”;

my $ pdf = CAM :: PDF - > new($ file_name); 我的$ no_pages = $ pdf-> numPages();

for(my $ i = 1; $ igetPageText($ i);     打印“$ page \ n”;     #你可以把它读成数组/等等......操作可以在这里完成     }

答案 6 :(得分:0)

交互式地,有完整版的Acrobat。以编程方式提供Adobe的Acrobat SDK和许多第三方解决方案。 Google Acrobat API