我知道很多人一直在问如何通过正则表达式从字符串中删除HTML标签,但我无法立即找到我想要的内容。
我找到的最接近的答案是:https://stackoverflow.com/a/17668453/8417376,建议使用<(?:[^>=]|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>
作为正则表达式。
不幸的是,当您有以下示例时,这不起作用:<p>value < other value </p>
(在这种情况下,< other value </p>
被视为HTML标记)
有没有人有一个好的解决方案?
提前致谢!
PS:如果有更好的方法在C#中这样做,请不要犹豫,让我知道! :)答案 0 :(得分:0)
试试这个:
<(?:[^><=]|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>