RSS转义HTML

时间:2011-03-09 20:09:09

标签: html rss

我对RSS的“转义HTML”的理解是这样的:

HTML:

1 < 3

成为(RSS):

1 < 3

那么,那应该是这样的:

<img src="http://somehost/someimage?a=foo&amp;b=bar" />

成为:

&lt;img src="http://somehost/someimage?a=foo&amp;amp;b=bar" /&gt;

(注意&amp;amp;如果是,那么这是无效的RSS吗?

<description>
    ...
    &#60;img src="http://d.yimg.com/a/p/ap/20110309/capt.f6...02-0.jpg?x=91&amp;y=130&amp;q=85&amp;sig=6oI7fIgN0izc9olfgY56vw--" />
</description>

(另外,关闭&gt; 不是转义不好吗?)

上述&lt; description&gt;的问题。我所拥有的是,一旦您解码第一层实体(XML)以获得&lt; description&gt;的内容标签,你得到一个长CDATA,它应该是HTML。问题是&lt; img&gt;只有一个&,这是一个无效的实体。对于上面的大块,我得到类似<img src="....?x=1&y=2" />的东西,它不是有效的HTML。

我只是看着被推到RSS中的糟糕的HTML,还是我在这里遗漏了什么?

1 个答案:

答案 0 :(得分:6)

您需要使用CDATA部分

<description><![CDATA[ <img src="http://somehost/someimage?a=foo&amp;b=bar" /> ]]>
</description>