我必须删除字符串中的span标记:
<span>Operation Gambling:</span><span>la mano della crimitalità </span><span>sull'azzardo</span>
为此,我使用以下正则表达式:
Regex.Replace(inHTML, "<span[^>]*?>", string.Empty).Replace("</span>", " </span>");
结果有时是正确的,但在这种情况下是:
Operazione Gambling: la mano della crimitalità sull azzardo
正如您所看到的,单引号已被删除,如何通过修改模式来保留它?
答案 0 :(得分:4)
您可以使用此代码删除字符串中的HTML标记:
var str = "<span>Operation Gambling:</span><span>la mano della crimitalità </span><span>sull'azzardo</span>";
String result = Regex.Replace(str, @"<[^>]*>", String.Empty);
System.Console.WriteLine(result);
或者这个正则表达式只删除span标签:
Regex.Replace(str, @"</?span( [^>]*|/)?>", String.Empty);