我正在尝试使用Docx4j版本3将docx转换为html。
该文档包含由制表符,空格和换行符组成的空白区域。生成的HTML要么具有无法识别的字符,要么根本不保留空格。
我使用的java代码是:
WordprocessingMLPackage wordMLPackage = Docx4J.load(is);
HTMLSettings htmlSettings = Docx4J.createHTMLSettings();
htmlSettings.setImageDirPath( System.getProperty("user.dir") + uploadedImagesDirectory );
htmlSettings.setWmlPackage(wordMLPackage);
Docx4J.toHTML(htmlSettings, out, Docx4J.FLAG_EXPORT_PREFER_XSL);
String result = ((ByteArrayOutputStream)out).toString();
如何保留文档中的空格。还有,有一种方法将css应用于特定节点吗?具体来说,我有3张图像应该在页面上水平均匀分布。
我查看了文档并在线搜索但没有成功。
谢谢。
答案 0 :(得分:1)
我解决了这个问题,它与Docx4j无关。 Docx4j完美地解析了文档!问题与通过电子邮件发送输出有关。
我设置了Spring helper javamail mime编码来解决这个问题:
MimeMessageHelper message = new MimeMessageHelper(mimeMessage, true, "utf-8");