使用php阅读pdf文件

时间:2010-12-17 14:15:40

标签: php pdf filereader

  

可能重复:
  Read pdf files with php

您好,

我有大量的pdf文件。我想阅读使用PHP脚本。我搜索了很多,但每个人都在创建pdf文件。在这里,我不想创建PDF文件,但我想阅读它。有没有办法把它读成php?

-Arun

2 个答案:

答案 0 :(得分:0)

您可以使用命令行实用程序(如Pdftotext)轻松读取PDF文件的内容,您可以通过exec调用它。

这是我的意思的一个例子,实际上是使用system

system("pdftotext your.pdf /tmp/txtfile.txt");
$text = file_get_contents("/tmp/txtfile.txt");

修改

不知道破折号语法 - 这更好:

$content = shell_exec('pdftotext your.pdf -');

这确实需要在您的服务器上安装pdftotext。在CentOS服务器上,这将是:

yum install xpdf

答案 1 :(得分:0)

要从PDF文件中获取文本,请尝试以下方法:
  - http://davidwalsh.name/read-pdf-doc-file-php
  - http://www.webcheatsheet.com/php/reading_clean_text_from_pdf.php(更深入)

对于更重量级的解决方案,请看一下:
  - http://www.setasign.de/products/pdf-php-solutions/fpdi/