C#RegExp删除span标记并保留引号char

时间:2015-07-27 08:28:32

标签: c# regex

我必须删除字符串中的span标记:

<span>Operation Gambling:</span><span>la mano della crimitalità </span><span>sull'azzardo</span>

为此,我使用以下正则表达式:

Regex.Replace(inHTML, "<span[^>]*?>", string.Empty).Replace("</span>", "&nbsp;</span>");

结果有时是正确的,但在这种情况下是:

Operazione Gambling: la mano della crimitalità sull&nbsp;azzardo

正如您所看到的,单引号已被删除,如何通过修改模式来保留它?

1 个答案:

答案 0 :(得分:4)

您可以使用此代码删除字符串中的HTML标记:

var str = "<span>Operation Gambling:</span><span>la mano della crimitalità </span><span>sull'azzardo</span>";
String result = Regex.Replace(str, @"<[^>]*>", String.Empty);
System.Console.WriteLine(result);

或者这个正则表达式只删除span标签:

Regex.Replace(str, @"</?span( [^>]*|/)?>", String.Empty);