将XML中存在的HTML转换为格式化的可显示内容,最终转换为PDF而不是标记为html

时间:2011-02-10 11:35:52

标签: html xml apache-fop

我正在使用FOP将XML转换为PDF。我们拥有的一个字段是一个富文本字段,它以HTML格式返回内容。 因此,当生成XML时,该字段将为BOLD]]>

我想将其转换为显示的粗体[文字 BOLD ],而不是我的PDF包含文字< b> BOLD< / b>在那个特定的部分。

实现这一目标的最简单方法是什么?

1 个答案:

答案 0 :(得分:0)

我们为此问题找到的解决方案是双重转换。

从XML中提取html,在该html上应用适当的XSL以获取FO,然后将此FO合并到主XSL中,并将合并的XSL应用于原始XML以获取最终的PDF。

来自xxl的html来自IBM文章: http://www.ibm.com/developerworks/library/x-xslfo2app/