用于根据模式从pdf文件中删除页面的Perl脚本

时间:2016-05-28 04:08:46

标签: perl pdf-generation

我们有一份长达3,000页的PDF文件,我们希望根据模式删除页面。

例如,在PDF中找到的pagenot有50页。现在,通过从文档中删除50页,输出类似于2,950页。

1 个答案:

答案 0 :(得分:1)

请你试试这个:

use strict;
use warnings;
use CAM::PDF;

my $pdf = CAM::PDF->new('input.pdf');
my $ttl_pgs = $pdf->numPages();

for(1..$ttl_pgs)
{
    my $pagnum = $_;
    my $pdf_cnt = $pdf->getPageContent($pagnum);
    if($pdf_cnt=~m/pages not found/i)
    {
         $pdf->deletePage($pagnum);
    }
}
$pdf->cleanoutput('output.pdf');