将HTML转换为DOCX

时间:2012-08-08 15:21:22

标签: html maven docx doc file-conversion

我正在寻找将HTML文档转换为DOCX文档的所有可能性。

背景:

我有一些文档,它是用HTML编写和维护的(没有复杂的东西,只有简单的H1H2PIMG元素,而且我会喜欢将它们转换为word文档。

Maven插件非常棒,或者可以让我在应用程序的发布阶段进行此转换。

1 个答案:

答案 0 :(得分:2)

披露:docx4j是“我的”项目

对于结构良好的XHTML,docx4j 2.8.0可以做到这一点。请参阅ConvertInXHTML* examples

docx4j在Maven Central中,但对于XHTML导入,您可能希望使用a more recent nightly build,因为您需要与XHTML相关的修复。

如果你想要一个Maven插件,你必须自己创建。