我正在创建一个网站,作者可以在其中创建EPUB个文件。用户将以.doc
格式上传图书。我需要创建EPUB文件。一个单独的doc文件将包含多个章节。所以我需要解析doc
文件并将其拆分为章节。作者将使用Heading 1
作为章节标题。
所以在PHP
中,有没有办法将doc
文件解析为HTML
并使用Heading 1
将其拆分为章节,以便我可以创建EPUB文件。< / p>
经过一番研究,我得到了一个linux app。但我认为,它会将doc转换为纯文本。所以我将无法分开这些章节。
如果有,请建议我解决方案。提前谢谢。
答案 0 :(得分:1)
您可以使用 PHPDOCX API 来实现此目的。
首先尝试使用this函数引用
从Word文档生成XHTML像这样......
require_once '../../classes/TransformDoc.inc';
$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();
获取XHTML内容后,您可以执行removing chapter等各种处理。
可以找到完整的文档 here 。