用PHP或JS读取PDF文件,然后按理想文本提取内容

时间:2015-06-23 16:54:16

标签: php file pdf

我的任务是在DB或文件夹中上传后阅读pdf文件,

这里的问题是:如何阅读PHP或JS,JQuery,AJAX中的PDF文件, 然后我想恢复数据以注入表单字段。

使用文本文件执行此过程有很多信息,但pdf似乎很复杂。有一个PHP类吗?我不习惯在Php课程,但有了信息,它会引导我。

非常感谢您的帮助!! 有一个好消息!

1 个答案:

答案 0 :(得分:2)

我设法使用http://www.pdfparser.org/

执行此操作

我需要pdf文件中的规范并获取所有原始文本。这是我使用的代码:

<?php
include 'pdfparser-master/vendor/autoload.php';
$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('specs.pdf');

$text = $pdf->getText();
echo $text;
?>