是否可以使用PHP将doc文件转换为HTML?

时间:2013-08-20 06:04:07

标签: php linux

我正在创建一个网站,作者可以在其中创建EPUB个文件。用户将以.doc格式上传图书。我需要创建EPUB文件。一个单独的doc文件将包含多个章节。所以我需要解析doc文件并将其拆分为章节。作者将使用Heading 1作为章节标题。

所以在PHP中,有没有办法将doc文件解析为HTML并使用Heading 1将其拆分为章节,以便我可以创建EPUB文件。< / p>

经过一番研究,我得到了一个linux app。但我认为,它会将doc转换为纯文本。所以我将无法分开这些章节。

如果有,请建议我解决方案。提前谢谢。

1 个答案:

答案 0 :(得分:1)

您可以使用 PHPDOCX API 来实现此目的。

首先尝试使用this函数引用

从Word文档生成XHTML

像这样......

require_once '../../classes/TransformDoc.inc';

$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();

获取XHTML内容后,您可以执行removing chapter等各种处理。

可以找到完整的文档 here