XSLT - 删除HTML标记(白名单除外)但保留内容

时间:2013-10-24 13:27:28

标签: html xml xslt

我需要删除所有HTML标记,但有些标记已列入白名单,但内容应保留。 例如:

<root>
  <item>
  &lt;p&gt;&lt;img height="269" alt="" hspace="5" src="[some src]" width="200"    align="right" /&gt;Sample TEXT &lt;strong&gt;Sample text&lt;/strong&gt; &lt;em&gt;Sample  text text text&lt;/em&gt; &lt;/p&gt;
  </item>
</root>

我希望在上面的示例中删除所有HTML格式,但保留强标记,并保留所有文本信息。所以代码将转换为这样的代码:

<root>
  <item>
  Sample TEXT &lt;strong&gt;Sample text&lt;/strong&gt; Sample  text text text
  </item>
</root>

为此目的xslt(版本1.0 )会是什么样的?

0 个答案:

没有答案