我想从PHP解析PDF文件。为此,我构建了这段代码(我使用了PDF Parser库)。
代码:
<?php
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('XA035 - Luis gui Lopes esteves.pdf');
$text = $pdf->getText();
echo $text;
?>
使用此代码,我可以从PDF文件中读取文本,但我无法解析信息,例如,如果在文件中我有这行:
个人信息Marco Mengoni
意大利
Via della giustizia
当我给我的页面调用echo $ text;在页面上打印:
个人信息Marco Mengoni Italia Via Della Giustizia。
现在有一种模式可以解析单行????