我需要删除所有HTML标记,但有些标记已列入白名单,但内容应保留。 例如:
<root>
<item>
<p><img height="269" alt="" hspace="5" src="[some src]" width="200" align="right" />Sample TEXT <strong>Sample text</strong> <em>Sample text text text</em> </p>
</item>
</root>
我希望在上面的示例中删除所有HTML格式,但保留强标记,并保留所有文本信息。所以代码将转换为这样的代码:
<root>
<item>
Sample TEXT <strong>Sample text</strong> Sample text text text
</item>
</root>
为此目的xslt(版本1.0 )会是什么样的?