为什么在转换pdf文件时Pdfparser返回不可读的文本?

时间:2019-05-21 07:02:55

标签: php

我试图将pdf文件的内容解析为文本,因此可以将其内容放入数据库中。它适用于某些文件,但我发现其中的一个返回不可读的文本。我对此一无所知,有人建议吗?

我尝试将其解析为一个完整的文档,并按每个页面进行解析,并且尝试使用另一个插件,但仍然无法正常工作。

$PdfParser = new \Smalot\PdfParser\Parser();
$pdf = $PdfParser->parseFile($file);
$text -> getText();
echo $text;

我希望返回的内容将像其他文件一样是纯文本。 但是它返回的是这样的。 Unreadable

0 个答案:

没有答案