提取pdf内容并将其转换为word或csv

时间:2015-03-28 13:25:32

标签: php html

我是首发。 我有一个pdf文件。 我想要一个php程序,其中我可以提取pdf的内容并以word或csv输出。

1 个答案:

答案 0 :(得分:1)

要阅读PDF文件,您需要安装XPDF包,其中包含“pdftotext”。安装XPDF / pdftotext后,运行以下PHP语句以获取PDF文本:

content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -');

获取内容后,请下载PHPDOCX社区版,试试这样。

<?php
require_once '../../classes/CreateDocx.inc';

$docx = new CreateDocx();
$textInfo = $content;

$paramsTextInfo = array(
    'val' => 1,
    'i' => 'single',
    'sz' => 8
);

$docx->addText($textInfo, $paramsTextInfo);

$docx->createDocx('report.docx');
?>