我从数据库中获取了一些数据,它有HTML编码字符(
)。有什么选择可以删除这些?
我根本不希望这些渲染...我希望它们从数据中删除。
目前我并不担心HTML标签......只是编码字符。
编辑:如果相关,这些字符会导致JSON验证中出现一些错误。
答案 0 :(得分:1)
如果你想摆脱它们,获取一个这样的字符列表或一个匹配它们的RegExp(类似&[a-z]+;
)并进行搜索和替换。
但是,如果您只是希望它们因JSON验证中的错误而消失,那么您应该正确生成/编码JSON以避免错误。 (但是,我真的不明白它们如何导致无效的JSON。)
答案 1 :(得分:0)
简单地通过regexp修剪不应该是一个选项。例如,
也可以编码为 
,但&\#[0-9]+;
正则表达式会导致数据丢失,因为几乎每个字符都可以在某些时候编码
(例如:<p>HELLO</p>
)。