我正在使用Smalot的PDFParser
使用PDF2Text
可以毫无问题地转换我的部分PDF文件。不幸的是,它经常返回空内容或没有换行符。虽然来自Smalot的PDFParser
的演示转换了我的所有pdf而没有任何问题。使用composer后使用composer进行安装后,我得到一个连接重置(ERR_CONNECTION_RESET
)。
我已经尝试set_time_limit
来增加执行时间并将内存限制设置为1024M,但两者都没有成功。
从命令行调用我的php工作正常。
我还尝试在http://pdfparser.org/demo上转换这些pdf,然后在这里转换它们没有任何问题。
我在索引文件中没有做任何特别的事情。 这是内容,如果它无论如何有用
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('test.pdf');
$text = $pdf->getText();
echo $text;