我试图将pdf文件的内容解析为文本,因此可以将其内容放入数据库中。它适用于某些文件,但我发现其中的一个返回不可读的文本。我对此一无所知,有人建议吗?
我尝试将其解析为一个完整的文档,并按每个页面进行解析,并且尝试使用另一个插件,但仍然无法正常工作。
$PdfParser = new \Smalot\PdfParser\Parser();
$pdf = $PdfParser->parseFile($file);
$text -> getText();
echo $text;
我希望返回的内容将像其他文件一样是纯文本。 但是它返回的是这样的。 Unreadable