我用过这个插件,它工作正常,但是对于某些文件,返回不同的(不可读的)格式。请建议我什么问题以及如何解决。
答案 0 :(得分:0)
Pdf2Text不适用于某些pdf文件,或者提供的文本不可读,因此请尝试另一个在将pdf转换为文本时效果很好的类
使用PdfToText类PdftoText
include ('PdfToText.php') ;
$pdf = new PdfToText ('pdf_files/chronopost1.pdf');
$pdf_text = $pdf->Text;
// cleaning text
$pdf_text = str_replace("\n", " ", $pdf_text);
$pdf_text = preg_replace('!\s+!', ' ', $pdf_text);
$pdf_text = trim($pdf_text);
echo "OUTPUT: " . $pdf_text;