PHP:从PDF

时间:2015-10-28 16:45:43

标签: php pdf extract attachment

如何从PDF文件中提取附件?我正在阅读的PDF附有一个XML文件,我无法找到获取它们的方法。

2 个答案:

答案 0 :(得分:0)

我最后安装了poppler-utils,命令为pdfdetach

答案 1 :(得分:0)

通过使用核心PHP:

#$file_path = absolute file path
#$attachment_extension = attachment extension eg. xml

$content = @file_get_contents($file_path, FILE_BINARY);

preg_match_all('/Type\/Filespec\/UF\((.*?)\)>>/', $content, $match);

$file_names = $match[1];
preg_match_all("#$attachment_extension>>stream(.*)endstream#ismU", $content, $attachments); 
$attachments = $attachments[1];

for($i=0; $i < count($attachments); $i++){
    $final_attrs[$file_names[$i]] = @gzuncompress(trim($attachments[$i]));  
}

#$final_attrs this is the array of files.