使用DOCX4J从DOCX生成简单的HTML

时间:2018-08-21 15:46:51

标签: java html docx docx4j

我正在尝试使用docx4j将.docx文件转换为html。但是,当我将文档转换为html时,剩下很多不必要的html标签。例如:

<p class="Heading1 Normal DocDefaults "><span class="" style="font-family: 'Cambria';">This is a heading</span></p>

转换为我的word文档中存在的标题产生了上述结果。理想情况下,我希望仅用一个简单的<h1>标记删除类标记和样式标记,以表示它是一个标题。

是否有任何方法可以修改代码,因此Docx4j可以实现吗?

0 个答案:

没有答案