我想以编程方式将Microsoft Word文档转换为XHTML。选择的语言是PHP,所以我很感激PHP的任何建议。
最初的想法是尝试将doc文件转换为odt,然后使用Odt2Xhtml PHP类将其转换为XHTML格式。
有更好的方法吗?
答案 0 :(得分:5)
如果您正在运行Linux,那么可以在服务器上安装OpenOffice。
可以找到“无头”(即无UI)安装的示例说明here。
然后,您可以使用通过shell_exec执行的unoconv这样的好的CLI应用程序来通过PHP进行转换。
答案 1 :(得分:2)
最强大的方法是use COM to let Word save the document as HTML。
我不知道Word是否可以直接生成XHTML;如果没有,Google会显示plenty of options进行转换。
答案 2 :(得分:0)
请参阅http://www.codeplex.com/OpenXMLViewer,其中包含您可以调整的XSLT,这是我在docx4j中所做的。但请注意,XSLT不适合胆小的人!
答案 3 :(得分:0)
phpLiveDocx 提供了一种转换Microsoft Word文档的简便方法。
在项目网站了解更多信息:
您还可以使用phpLiveDocx将文本数据与MS Word模板合并,并将生成的文档保存为DOC,DOCX,RTF,PDF或TXT。
该组件是企业级的,并且是为Zend Framework编写的。