pdf2text转换器插件返回的格式不可读

时间:2018-08-14 09:52:16

标签: php

我用过这个插件,它工作正常,但是对于某些文件,返回不同的(不可读的)格式。请建议我什么问题以及如何解决。

1 个答案:

答案 0 :(得分:0)

Pdf2Text不适用于某些pdf文件,或者提供的文本不可读,因此请尝试另一个在将pdf转换为文本时效果很好的类

使用PdfToText类PdftoText

include ('PdfToText.php') ;
$pdf = new PdfToText ('pdf_files/chronopost1.pdf');

$pdf_text = $pdf->Text;
// cleaning text
$pdf_text = str_replace("\n", " ", $pdf_text);
$pdf_text = preg_replace('!\s+!', ' ', $pdf_text);
$pdf_text = trim($pdf_text);

echo "OUTPUT: " . $pdf_text;