如何使用docx4j将HTML转换为.docx?

时间:2013-12-09 00:41:40

标签: java html converter docx docx4j

我阅读了一些关于html转换为.docx的文章,我发现docx4j给出了相当不错的结果。我想知道是否有人可以提供以下信息:

  1. 需要jars和版本。
  2. html转换为.docx的示例代码。
  3. 很抱歉,我无法发布任何我尝试过的内容,因为我还没有尝试过这项任务,尽管我使用Apache POIbytes[]转换为datatabse { {1}}在html应用程序的rich text editor输出。请赐教,我在压力和困惑中迷失了......!

1 个答案:

答案 0 :(得分:4)

要导入XHTML,请使用

<dependency>
    <groupId>org.docx4j</groupId>
    <artifactId>docx4j-ImportXHTML</artifactId>
    <version>3.0.0</version>
</dependency>

进一步查看http://www.docx4java.org/blog/2013/11/docx4j-3-0-and-maven/

有关示例代码,请参阅https://github.com/plutext/docx4j-ImportXHTML/tree/master/src/samples/java/org/docx4j/samples

请注意,您的输入需要是格式良好的XML,因此如果您有HTML,则需要先将其整理(使用众多可以为您执行此操作的Java库之一)。