我的HTML来自第三方来源。
我需要删除长字符串末尾的所有尾随空格和换行符,该字符串本身包含我需要的<br>
个标记。
例如,文字可能是:
This is some text<br>The End<br><br> <br><br> <br><br> <br><br><br><br>
我需要删除所有那些尾随<br>
标签,其中一些标签之间有随机空白区域,有些则没有,同时保留了内置<br>
。
在C#中实现此目的的最佳方法是什么?我在string
中获得它?
我倾向于regex
,但我似乎无法找到只处理字符串尾端的正确的那个。
答案 0 :(得分:3)
如果您的行是字符串(您不需要解析html),请使用Regex:
string input = @"This is some text<br>The End<br><br> <br><br> <br><br> <br><br><br><br>";
var output = Regex.Replace(input,@"(\<br\>\s?)+$",@"<br>");
//Result:
//This is some text<br>The End<br>