在PHP中获取PDF文件的内容

时间:2016-04-23 10:27:48

标签: php parsing pdf

我有一个FlipBook jquery页面,并且显示的电子书(pdf格式)太多了。我需要隐藏这些PDF,以便我希望用PHP获取其内容并使用我的FlipBook jquery页面显示它。 (而不是给出整个pdf我想把它作为部分给出。)

有什么办法可以用PHP获取PDF文件的全部内容吗? 我需要根据他们的页面将它们分开。

1 个答案:

答案 0 :(得分:2)

嗯..!您可以使用PDF Parser(PHP PDF库)来提取每个 以及PDF的所有内容..!

PDF Parser Library Link http://www.pdfparser.org/

在线演示链接: http://www.pdfparser.org/demo

文档链接: http://www.pdfparser.org/documentation

示例代码:

<?php

// Include Composer autoloader if not already done.
include 'vendor/autoload.php';

// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

$text = $pdf->getText();
echo $text;

?>

关于你的问题的另一部分:

如何将PDF页面转换为图像:

您需要ImageMagickGhostScript

<?php
$im = new imagick('file.pdf[0]');
$im->setImageFormat('jpg');
header('Content-Type: image/jpeg');
echo $im;
?>

[0]表示page 1