正则表达式删除除给定字符之外的字符?

时间:2012-06-07 19:41:16

标签: c# .net regex string c#-4.0

我想删除字符串,但只留下以下内容:

[a-zA-Z]+[_a-zA-Z0-9-]*

我正在尝试输出以字符开头的字符串,然后可以使用字母数字,下划线和短划线。如何使用RegEx或其他功能执行此操作?

5 个答案:

答案 0 :(得分:2)

因为正则表达式第二部分中的所有内容都在第一部分中,所以你可以这样做:

String foo = "_-abc.!@#$5o993idl;)"; // your string here.
//First replace removes all the characters you don't want.
foo = Regex.Replace(foo, "[^_a-zA-Z0-9-]", "");
//Second replace removes any characters from the start that aren't allowed there.
foo = Regex.Replace(foo, "^[^a-zA-Z]+", "");

因此,首先将其削减到仅允许的角色。然后摆脱任何不可能在开头的字符。

当然,如果你的正则表达式变得更复杂,这个解决方案会很快崩溃。

答案 1 :(得分:0)

  

被修改

   var s = Regex.Matches(input_string, "[a-z]+(_*-*[a-z0-9]*)*", RegexOptions.IgnoreCase);
            string output_string="";
            foreach (Match m in s)
            {
                output_string = output_string + m;

            }
    MessageBox.Show(output_string);

答案 2 :(得分:0)

假设你在集合中有字符串,我会这样做:

  1. 集合中的foreach元素尝试匹配正则表达式
  2. if!success,从集合中删除字符串
  3. 或者反过来 - 如果匹配,则将其添加到新集合中。

    如果字符串不在集合中,您可以添加更多关于输入内容的详细信息吗?

答案 3 :(得分:0)

如果要提取与正则表达式匹配的所有标识符,可以这样做:

var input = " _wontmatch f_oobar0 another_valid ";
var re = new Regex( @"\b[a-zA-Z][_a-zA-Z0-9-]*\b" );
foreach( Match match in re.Matches( input ) )
    Console.WriteLine( match.Value );

答案 4 :(得分:0)

使用MatchCollection matchColl = Regex.Matches("input string","your regex");

然后使用:

string [] outStrings = new string[matchColl.Count]; //A string array to contain all required strings

for (int i=0; i < matchColl.Count; i++ )
     outStrings[i] = matchColl[i].ToString();

您将在outStrings中拥有所有必需的字符串。希望这会有所帮助。