使用Apache POI + fr.opensagres.xdocreport将Word(.docx!)转换为html

时间:2018-02-16 09:41:32

标签: java html apache-poi docx xdocreport

我只能使用Apache POI将旧的 .doc 文件转换为 html

对于 .docx ,我必须使用fr.opensagres.xdocreport包。 代码非常简单:

    XWPFDocument document = new XWPFDocument(inputStream);
    OutputStream outputStream = new ByteArrayOutputStream();
    XHTMLOptions options = XHTMLOptions.create().indent(4).setImageManager(new Base64EmbedImgManager());
    XHTMLConverter.getInstance().convert(document, outputStream, options);
    return outputStream.toString();

然而,有两个问题

  • 嵌入的Excel图表被忽略(使用Apache POI的 .doc 转换将它们转换为图像,就像使用任何其他普通图像一样)
  • 具有自定义各种格式组合的文本未正确呈现,不必要地插入了几个新行。 (请参阅inputoutput示例)

有人知道解决这个问题的方法吗?

谢谢。

0 个答案:

没有答案