删除部分字符串C#

时间:2012-07-03 13:30:38

标签: c# string split tokenize

我在我的网站上使用富文本编辑器,我使用标签显示用户上次使用该框时输入的内容,但是当他提交代码时,它包含来自标签的html。当我提交表格时,它会写下以下内容....

<span id="bodyContent_header1"> <div style"float:right">The Text On The Page </div> </span>

我需要从代码中删除<span id="bodyContent_header1"> </span>并保留其余部分。有人可以帮忙吗?此外,代码可能包含其他span标记,因此每次只应删除此标记。

2 个答案:

答案 0 :(得分:3)

鉴于此类字符串是一行,您可以使用正则表达式^<span[^>]+>|</span>$替换最外面的<span>标记,如下所示:

string strRegex = @"^<span[^>]+>|</span>$";
RegexOptions myRegexOptions = RegexOptions.Multiline | RegexOptions.Singleline;
Regex myRegex = new Regex(strRegex, myRegexOptions);
string strTargetString = @"<span id=""bodyContent_header1""> <div style""float:right"">The Text On The Page </div> </span>\n";
string strReplace = @"";
return myRegex.Replace(strTargetString, strReplace);

这适用于RegexHero

答案 1 :(得分:1)

此正则表达式从此标记中选择数据

(?<=<span id="bodyContent_header1">)(.+)(</span>)

使用一个正则表达式替换imposible

来解决此任务