删除HTML编码字符

时间:2013-01-01 22:07:56

标签: c# asp.net-mvc-3 html-encode

我从数据库中获取了一些数据,它有HTML编码字符( )。有什么选择可以删除这些?

我根本不希望这些渲染...我希望它们从数据中删除。

目前我并不担心HTML标签......只是编码字符。

编辑:如果相关,这些字符会导致JSON验证中出现一些错误。

2 个答案:

答案 0 :(得分:1)

如果你想摆脱它们,获取一个这样的字符列表或一个匹配它们的RegExp(类似&[a-z]+;)并进行搜索和替换。

但是,如果您只是希望它们因JSON验证中的错误而消失,那么您应该正确生成/编码JSON以避免错误。 (但是,我真的不明白它们如何导致无效的JSON。)

答案 1 :(得分:0)

简单地通过regexp修剪不应该是一个选项。例如,&nbsp;也可以编码为&#160;,但&\#[0-9]+;正则表达式会导致数据丢失,因为几乎每个字符都可以在某些时候编码 (例如:<p>&#72;&#69;&#76;&#76;&#79;</p>)。