在VB.NET中是否有任何方法可以删除HTML中标记之间的所有空格?
说,我有这个:
<tr>
<td>
我构建的字符串是一个完整的HTML文档,它将这些标记之前的所有内容计为合法空间,因此我需要将其修剪掉。是否有我可以使用的注册表或功能?
由于
答案 0 :(得分:1)
根据文档的复杂程度,您可能只需要在文档中替换正则表达式...类似于:
RegexObj.Replace( “&GT; [\ S \ n]的* LT;”, “&GT;&LT;”)
您可以阅读有关.NET和正则表达式here
的内容答案 1 :(得分:0)
上述解决方案是一个良好的开端,但代码略有错误,正则表达式超出了它的需要。以下是在这种情况下您需要做的最小值:
Dim RegexObj As New Regex(">[\s]*<")
NewText = RegexObj.Replace(OldText, "><")
\n
是不必要的,因为.Net包含空白字符集(\s)
中的回车符和换行符。不确定其他语言。如果没有,您还需要包含\r
字符,因为正则表达式中的Windows换行符为\r\n
,而不仅仅是\n
。