将pdf转换为php中的文本文件(注意:shell_exec已禁用)

时间:2012-04-18 22:34:44

标签: php pdf text text-files

解决此问题的最佳方法是使用“xpdf”软件包中的“pdftotext”,但在我搜索的所有共享主机中,shell_exec被禁用。我发现只使用php的替代方法就像一个名为pdf2string()的函数(在php.net上),但这些函数都没有按预期工作(有些pdf文件,他们只是没有输出正确的文本和其他一些pdf他们没有输出任何东西,这个功能的其他一些版本根本没用,所以我排除了这个选项)。有什么方法可以将开源pdftotext转换为php脚本? (源代码是c ++,我认为可以在这里找到:http://www.foolabs.com/xpdf/download.html)。任何其他解决方案将被接受,只要它给我pdf的文本输出(正确的)

1 个答案:

答案 0 :(得分:3)

由于您的环境受限,您可能需要查看此内容。 http://webcheatsheet.com/php/reading_clean_text_from_pdf.php

这不使用外部库来解析pdf到文本格式。 但是,由于这解析了原始pdf格式的文本,我不确定它是多么稳定。