删除所有制表符,空白/制动/新行,空行,除单个空格字符外的多个连续空格

时间:2015-05-07 11:00:09

标签: regex

我有一个HTML代码,如下所示:

   <TABLE>
      <TR>
        <TD>Item</TD>
        <TD><A>48</A> 
                    </TD></TR>
      <TR>
        <TD>Item</TD>
        <TD><A >48</A> 
                    </TD></TR>
      <TR>
        <TD>Tags</TD>
        <TD><A> 
          keyword</A>, <A>keyword 
          </A>, <A>keyword
          </A>, <A>keyword</A>, <A 
          >keyword</A>, <A 
          >keyword 
          </A>, <A>keyword 
           </A>             
   </TABLE>

使用 .NET 正则表达式,任何人都可以帮我删除所有空白字符 EXCEPT 单个空格字符,以便我最终用一长串代码?

2 个答案:

答案 0 :(得分:1)

以下正则表达式可以实现这一点,

\s{2,} // \s will match all whitespaces, and {2,} tells it, there needs to be more then 1

您可以在c#中使用它:

string output = Regex.Replace(input, @"\s{2,}", "");

效果:

enter image description here

答案 1 :(得分:1)

您可以使用此正则表达式:

[\p{Z}\s]{2,}

这将检查是否至少有2个空格字符。如果找到则替换为空字符串。

\p{Z}代表All Separators Unicode简写类。

请参阅demo