docx4j:提高表现

时间:2018-03-06 21:05:48

标签: java ms-word xhtml docx docx4j

我正在使用docx4j进行一些测试。我需要做的是将复杂的Word文档(2-3页文本,表格,项目符号列表,图像)转换为xhtml。

我举了这个例子:https://github.com/plutext/docx4j/blob/master/src/samples/docx4j/org/docx4j/samples/ConvertOutHtml.java

它工作正常,我只有两个问题:

  1. 翻译word文档大约需要30秒。该行占用了95%的计算时间:

    wordMLPackage = Docx4J.load(new java.io.File(inputfilepath));

  2. 最终目标是创建一个简单的Web应用程序,获取Word文档(每次不同)并提供返回xhtml。用户不能等待这么久。有什么可以改善表演吗?为什么需要这么长时间(例如蒂卡的速度要快几百倍)?目前我正在我的笔记本电脑Eclipse IDE上运行它,无论如何,你认为一旦运行服务器端会更好吗?

    非常感谢。

1 个答案:

答案 0 :(得分:2)

加载JAXB上下文需要时间。它通常只完成一次,因此第一次加载会很慢。也就是说,它不应该花30秒!在我老化的笔记本电脑上,它大概是5秒。

您可以启用日志记录,以便更深入地了解JAXB Context init的大小。