在PHP中从PDF中提取文本

时间:2014-01-12 18:46:22

标签: php pdf

我正在创建一个基于php的Web应用程序,允许用户上传PDF文件。然后将读取该文件并检查某些数据(文本)。

问题是我无法弄清楚如何在PHP中打开PDF文件。有一些PDF库主要用于创建PDF,但它们似乎并不擅长阅读它们。

另一种解决方案是使用Python中已有的解决方案或其他东西(如本网站上的其他线程所述),但我真的希望尽可能多地保留PHP,因为我打算稍后导出数据到mysql等。

非常感谢有关如何阅读PDF并从中提取数据的任何输入。

1 个答案:

答案 0 :(得分:0)

我个人没有试过这个,但看起来这个有效:http://www.pdfparser.org/documentation 这只是下载和告诉您的代码包含它的问题,就像文档显示的那样。

或者您可以尝试http://www.phpclasses.org/browse/file/31030.html

中的class.pdf2text.php