如何转义Unicode字符

时间:2018-09-05 17:26:46

标签: c# html regex markup

我正在尝试使用如下正则表达式从字符串中转义标记和unicode字符

string b = Regex.Replace(StNameTag, "<[^>]+>|\u200B|\n|\t|\r", string.Empty);

但是问题在于它不能逃脱某些字符,例如&#160;,甚至某些字符串甚至都有

ED5D6EB4918943C197E874EF6414E351 .ExternalClass p.MsoNormal, ED5D6EB4918943C197E874EF6414E351 .ExternalClass li.MsoNormal, ED5D6EB4918943C197E874EF6414E351 .ExternalClass div.MsoNormal {margin-top:0in;margin-right:0in;margin-bottom:8.0pt;margin-left:0in;line-height:107%;font-size:11.0pt;font-family:"Calibri",sans-serif;}ED5D6EB4918943C197E874EF6414E351 .ExternalClass .MsoChpDefault {font-family:"Calibri",sans-serif;}ED5D6EB4918943C197E874EF6414E351 .ExternalClass .MsoPapDefault {margin-bottom:8.0pt;line-height:107%;}ED5D6EB4918943C197E874EF6414E351 .ExternalClass div.WordSection1 {}&#160;ABCD

我只需要上述字符串中的ABCD。我该如何逃脱它们。

0 个答案:

没有答案