Docx4j v3 Docx到带图像的HTML

时间:2014-03-19 20:55:35

标签: docx4j

我正在尝试使用Docx4j版本3将docx转换为html。

该文档包含由制表符,空格和换行符组成的空白区域。生成的HTML要么具有无法识别的字符,要么根本不保留空格。

我使用的java代码是:

WordprocessingMLPackage wordMLPackage = Docx4J.load(is);

HTMLSettings htmlSettings = Docx4J.createHTMLSettings();
htmlSettings.setImageDirPath( System.getProperty("user.dir") + uploadedImagesDirectory );
htmlSettings.setWmlPackage(wordMLPackage);

Docx4J.toHTML(htmlSettings, out, Docx4J.FLAG_EXPORT_PREFER_XSL);

String result = ((ByteArrayOutputStream)out).toString();

如何保留文档中的空格。还有,有一种方法将css应用于特定节点吗?具体来说,我有3张图像应该在页面上水平均匀分布。

我查看了文档并在线搜索但没有成功。

谢谢。

1 个答案:

答案 0 :(得分:1)

我解决了这个问题,它与Docx4j无关。 Docx4j完美地解析了文档!问题与通过电子邮件发送输出有关。

我设置了Spring helper javamail mime编码来解决这个问题:

MimeMessageHelper message = new MimeMessageHelper(mimeMessage, true, "utf-8");