docx4j以错误的html格式转换docx

时间:2013-04-18 12:10:51

标签: java html docx docx4j

我对docx4j样本有一些问题。我需要以html格式转换docx文件并返回。我正在尝试编译ConvertInXHTMLDocument.java示例。它创建的Html文件很好,但是当试图将其转换回docx时,抛出一个缺少close标签的异常(META,img等)。有人遇到过这个问题吗?

1 个答案:

答案 0 :(得分:1)

XHTMLImporter要求其输入是格式良好的XML。所以你需要确保你没有缺少关闭标签(META,img等);如果你这样做,先运行JTidy或类似的。

docx4j的(X)HTML输出可以是HTML或XML。从3.0开始,属性Convert.Out.HTML.OutputMethodXML将控制哪个。