docx4j html转换将一行分成多个span元素

时间:2013-09-13 11:59:28

标签: html docx docx4j

我对docx4j生成的html有一个小问题。在95%的情况下一切正常。但是文档中有一些行,它们被转换为具有相同样式的多个跨度。例如:

我有一行:S44_XYZ_ABC_AABBCCDD。文档中有多行这样的行,在转换过程中,只有1-2%的行以错误的方式转换。这一行成为:

<span style=...>S44</span>
<span style=...>_</span>
<span style=...>XYZ</span>
           ...etc.

因为,我正在用生成的html字符串中的其他文本替换这些标记,这对我来说是个问题。我尝试重新格式化该行,删除它并修改从另一个文档复制的另一个,转换没问题,但没有运气。

我认为这是某种与docx格式相关的问题,但我无法弄清楚原因。

非常感谢你!

1 个答案:

答案 0 :(得分:1)

Word可能会将您的文本S44_XYZ_ABC_AABBCCDD拆分为多次运行。

它可以出于各种原因执行此操作,包括语法/拼写检查,不同的格式化等等。要查看为什么会发生这种情况,请解压缩docx,然后查看word / document.xml

您可以运行VariablePrepare.java来解决此问题的原因。