C#删除我插入的跨区标签

时间:2011-11-03 19:41:18

标签: c# .net regex html-parsing

通过WYSIWYG文本编辑器,我插入带有“注释”类的span标签。我想从字符串

中删除span标记及其内容的任何实例

那我怎么从这里开始:

string content = "<p>sadf<span class="otherclass"><span class="comment">asdfsdafsdafsadfsdf</span></span></p>";

到这里:

content = "<p>sadf<span class="otherclass"></span></p>";

我知道HTMLAgilityPack但不想添加我控制的HTML的开销。我使用正则表达式解决方案。

编辑:我只想删除带有“评论”类的跨度。

2 个答案:

答案 0 :(得分:1)

答案不足:

content = Regex.Replace(content, @"<span\s+class=""comment"">.*?</span>", "");

答案 1 :(得分:0)

过滤字符串的正则表达式将是<span\s+class=\"comment.*?span>您可能有兴趣尝试使用RegexBuddy。它帮助我很好地理解我的正则表达式。

将正则表达式作为字符串捕获,将string content

替换为该字符串

在我意识到你需要删除{BLUEPIXY之后的<span class="comment"></span>之后编辑。