将Microsoft Word文档转换为XHTML的最佳方法是什么?

时间:2008-11-20 05:25:15

标签: php xhtml ms-word

我想以编程方式将Microsoft Word文档转换为XHTML。选择的语言是PHP,所以我很感激PHP的任何建议。

最初的想法是尝试将doc文件转换为odt,然后使用Odt2Xhtml PHP类将其转换为XHTML格式。

有更好的方法吗?

4 个答案:

答案 0 :(得分:5)

如果您正在运行Linux,那么可以在服务器上安装OpenOffice。

可以找到“无头”(即无UI)安装的示例说明here

然后,您可以使用通过shell_exec执行的unoconv这样的好的CLI应用程序来通过PHP进行转换。

答案 1 :(得分:2)

最强大的方法是use COM to let Word save the document as HTML

我不知道Word是否可以直接生成XHTML;如果没有,Google会显示plenty of options进行转换。

答案 2 :(得分:0)

请参阅http://www.codeplex.com/OpenXMLViewer,其中包含您可以调整的XSLT,这是我在docx4j中所做的。但请注意,XSLT不适合胆小的人!

答案 3 :(得分:0)

phpLiveDocx 提供了一种转换Microsoft Word文档的简便方法。

在项目网站了解更多信息:

http://www.phplivedocx.org

您还可以使用phpLiveDocx将文本数据与MS Word模板合并,并将生成的文档保存为DOC,DOCX,RTF,PDF或TXT。

该组件是企业级的,并且是为Zend Framework编写的。