使用Docx4J将HTML,RTF合并到Docx

时间:2015-01-22 14:42:45

标签: java html rtf docx docx4j

我是Docx4j的新手,我需要一些建议。

目前我正在使用Java创建一个简单的(X)HTML文档。它包含来自数据库的一些信息。创建此html后,Docx4j使用非常简单的单词模板创建Word-Docx文件。这很好。

现在我必须增强这个HTML。一个数据库值包含一个包含RTF文件的字节数组。

目前我将此数据作为字符串放入HTML中。

String content = new String(allbytes,"UTF-8");
html+=content;

至少html文件如下所示:

<html>
....
<td>
    {\rtf1\ansi\deflang1033\ftnbj\uc1\deff1..... 
</td>
...
</html>

Docx4J现在创建一个Word-Docx,它将此RTF显示为字符串而不是导入的RTF文件。

当然不是,但我希望将其视为导入的RTF。 我该如何存档? 有一种简单的方法可以做到这一点吗?

1 个答案:

答案 0 :(得分:0)

将rtf转换为docx内容超出了docx4j的范围。

您需要寻找第三方解决方案,该解决方案执行rtf到docx,或者失败,rtf到(x)html(参见Convert Rtf to HTML

您可以尝试http://sourceforge.net/projects/rtf2xml/,然后将XML转换为WordML。

另一种可能是LibreOffice通过JODConverter。