通过URL从PHP中提取PDF文档中的标题

时间:2017-01-25 22:47:15

标签: php pdf extract

我需要从(直接)网址中提取pdf文档的标题,因此我会收到像http://somepagehere/something/something.pdf这样的网址,我只需要提取此pdf文档的标题而无需下载整个文件。

我看到Zend Framework与此功能类似:

$pdf = Zend_Pdf::load($pdfFilePath);
$title=$pdf->properties['Title'];

但是,我如何在常规PHP中执行此操作,如何仅使用url(不需要下载整个文档)?感谢。

2 个答案:

答案 0 :(得分:0)

你在寻找basename()吗?

echo basename($pdfFilePath);

将返回:

something.pdf

答案 1 :(得分:0)

假设您需要在文档中提取标题(而不是PDF文件的名称),那么您很可能需要一个插件来处理它 - 它无法在常规PHP中完成(容易)。但是,有很多插件可供选择,您的使用可能比另一个更适用:

  • ApacheFOP
  • DOMPDF
  • FPDF
  • html2ps的
  • MPDF
  • 的PDFlib
  • TCPDF
  • wkhtmltopdf
  • Zend_Pdf

对于实际的标题提取,你可以采用这种方法;在加载整个PDF之后(不幸的是你必须这样做),你需要这样的东西:

$title=$pdf->properties['Title'];

希望这有帮助!