在某些情况下,使用docx4j将XHTML转换为docx会丢失原始样式

时间:2013-03-28 08:46:06

标签: ms-word xhtml docx4j

在我的测试中,我发现在将以下html内容转换为docx后,原始样式将会丢失。

  1. < a href="http://www.google.com">Google< /a>

    导致docx:没有下划线。

  2. < p>< span style="text-decoration: underline;">underline text< /span>< /p>

    导致docx:没有下划线

  3. < p>< span style="text-decoration: line-through;">delete text< /span>< /p>

    导致docx:no delete line

  4. < p style="margin-left:30.0px;">indent text< /p>

    导致docx:没有任何缩进

  5. < h1>header line< /h1>

    导致docx:仅纯文本

  6. < p>< span style="background-color: rgb(255,255,0);">background color< /span>< /p>

    导致docx:没有任何背景颜色

  7. < hr/>

    导致docx:空

  8. < table style="border-width:1px;"> ...

    导致docx:无边框

  9. < span style="font-family: arial , helvetica , sans-serif;font-size: large;"> ...

    导致docx:字体设置全部错过。

  10. 任何人都知道如何处理这些问题?或任何解决方法?

1 个答案:

答案 0 :(得分:1)

XHTMLImporter source code中的评论指出,有些事情仍有待实施。

你的#4,我认为支持缩进。也许不是你用过的单位?

重新排列#8桌边框,对这些边框有一些支持;谷歌的其他帖子。

实现下划线,删除和背景颜色都应该是直截了当的。

如果您愿意,我们很乐意接受拉取请求。