使用正则表达式从字符串中删除HTML标记,而不删除“<”标签

时间:2017-10-24 11:31:39

标签: c# html regex string tags

我知道很多人一直在问如何通过正则表达式从字符串中删除HTML标签,但我无法立即找到我想要的内容。

我找到的最接近的答案是:https://stackoverflow.com/a/17668453/8417376,建议使用<(?:[^>=]|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>作为正则表达式。

不幸的是,当您有以下示例时,这不起作用:<p>value < other value </p>(在这种情况下,< other value </p>被视为HTML标记)

有没有人有一个好的解决方案?

提前致谢!

PS:如果有更好的方法在C#中这样做,请不要犹豫,让我知道! :)

1 个答案:

答案 0 :(得分:0)

试试这个:

<(?:[^><=]|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>