VB.NET替换HTML标记之间的空格

时间:2009-01-15 14:15:33

标签: html vb.net string replace whitespace

在VB.NET中是否有任何方法可以删除HTML中标记之间的所有空格?

说,我有这个:

<tr>
    <td>

我构建的字符串是一个完整的HTML文档,它将这些标记之前的所有内容计为合法空间,因此我需要将其修剪掉。是否有我可以使用的注册表或功能?

由于

2 个答案:

答案 0 :(得分:1)

根据文档的复杂程度,您可能只需要在文档中替换正则表达式...类似于:

RegexObj.Replace( “&GT; [\ S \ n]的* LT;”, “&GT;&LT;”)

您可以阅读有关.NET和正则表达式here

的内容

答案 1 :(得分:0)

上述解决方案是一个良好的开端,但代码略有错误,正则表达式超出了它的需要。以下是在这种情况下您需要做的最小值:

Dim RegexObj As New Regex(">[\s]*<")

NewText = RegexObj.Replace(OldText, "><")

\n是不必要的,因为.Net包含空白字符集(\s)中的回车符和换行符。不确定其他语言。如果没有,您还需要包含\r字符,因为正则表达式中的Windows换行符为\r\n,而不仅仅是\n