如何从短划线以外的字符串中删除所有非字母数字字符?

时间:2010-07-09 06:45:32

标签: c# regex

如何从短划线和空格字符以外的字符串中删除所有非字母数字字符?

13 个答案:

答案 0 :(得分:771)

用空字符串替换[^a-zA-Z0-9 -]

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");

答案 1 :(得分:333)

我本可以使用RegEx,它们可以提供优雅的解决方案,但它们可能会导致性能问题。这是一个解决方案

char[] arr = str.ToCharArray();

arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c) 
                                  || char.IsWhiteSpace(c) 
                                  || c == '-')));
str = new string(arr);

使用紧凑框架(没有FindAll)时

1替换FindAll

char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || 
                             char.IsWhiteSpace(c) || 
                             c == '-')).ToArray(); 

str = new string(arr);

1 Comment by ShawnFeatherly

答案 2 :(得分:42)

您可以尝试:

   string s1= Regex.Replace(s,"[^A-Za-z0-9 _]","");

s是你的字符串。

答案 3 :(得分:33)

使用System.Linq

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());

答案 4 :(得分:21)

正则表达式为[^\w\s\-]*

\s最好使用而不是空格(),因为文本中可能有标签。

答案 5 :(得分:12)

根据这个问题的答案,我创建了一个静态类并添加了这些。认为它可能对某些人有用。

public static class RegexConvert
{
    public static string ToAlphaNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z0-9]");
        return rgx.Replace(input, "");
    }

    public static string ToAlphaOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z]");
        return rgx.Replace(input, "");
    }

    public static string ToNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^0-9]");
        return rgx.Replace(input, "");
    }
}

然后这些方法可以用作:

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();

答案 6 :(得分:4)

我做了一个不同的解决方案,删除了控制字符,这是我原来的问题。

这比列出所有“特别但好”的字符

更好
char[] arr = str.Where(c => !char.IsControl(c)).ToArray();    
str = new string(arr);

这更简单,所以我认为它更好!

答案 7 :(得分:3)

想要快速的东西?

public static class StringExtensions 
{
    public static string ToAlphaNumeric(this string self, params char[] allowedCharacters)
    {
        return new string(Array.FindAll(self.ToCharArray(), c => char.IsLetterOrDigit(c) || allowedCharacters.Contains(c)));
    }
}

这将允许您指定要允许的字符。

答案 8 :(得分:2)

这是我正在寻找的非正则表堆分配友好的快速解决方案。

不安全版。

public static unsafe void ToAlphaNumeric(ref string input)
{
    fixed (char* p = input)
    {
        int offset = 0;
        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsLetterOrDigit(p[i]))
            {
                p[offset] = input[i];
                offset++;
            }
        }
        ((int*)p)[-1] = offset; // Changes the length of the string
        p[offset] = '\0';
    }
}

对于那些不想使用不安全或不信任字符串长度黑客的人。

public static string ToAlphaNumeric(string input)
{
    int j = 0;
    char[] newCharArr = new char[input.Length];

    for (int i = 0; i < input.Length; i++)
    {
        if (char.IsLetterOrDigit(input[i]))
        {
            newCharArr[j] = input[i];
            j++;
        }
    }

    Array.Resize(ref newCharArr, j);

    return new string(newCharArr);
}

答案 9 :(得分:1)

我在这里使用其中一个答案的变体。我想用“ - ”替换空格,所以它的SEO友好,也做小写。也没有从我的服务层引用system.web。

private string MakeUrlString(string input)
{
    var array = input.ToCharArray();

    array = Array.FindAll<char>(array, c => char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-');

    var newString = new string(array).Replace(" ", "-").ToLower();
    return newString;
}

答案 10 :(得分:1)

这是一种以@ata答案为灵感的扩展方法。

"hello-world123, 456".MakeAlphaNumeric(new char[]{'-'});// yields "hello-world123456"

或者如果您需要除连字符以外的其他字符...

"hello-world123, 456!?".MakeAlphaNumeric(new char[]{'-','!'});// yields "hello-world123456!"


public static class StringExtensions
{   
    public static string MakeAlphaNumeric(this string input, params char[] exceptions)
    {
        var charArray = input.ToCharArray();
        var alphaNumeric = Array.FindAll<char>(charArray, (c => char.IsLetterOrDigit(c)|| exceptions?.Contains(c) == true));
        return new string(alphaNumeric);
    }
}

答案 11 :(得分:0)

如果您使用的是JS,这是一个非常简洁的版本

myString = myString.replace(/[^A-Za-z0-9 -]/g, "");

答案 12 :(得分:-1)

使用Regex有一种更简单的方法。

private string FixString(string str)
{
    return string.IsNullOrEmpty(str) ? str : Regex.Replace(str, "[\\D]", "");
}