用空字符串替换所有非字母数字字符

时间:2009-11-26 20:28:42

标签: java regex non-alphanumeric

我尝试使用它但没有用 -

return value.replaceAll("/[^A-Za-z0-9 ]/", "");

13 个答案:

答案 0 :(得分:223)

使用[^A-Za-z0-9]

注意:删除了空格,因为通常不会将其视为字母数字。

答案 1 :(得分:118)

尝试

return value.replaceAll("[^A-Za-z0-9]", "");

return value.replaceAll("[\\W]|_", "");

答案 2 :(得分:52)

您应该知道[^a-zA-Z]将替换字符范围A-Z / a-z中不属于自身的字符。这意味着特殊字符,如éß等,或者西里尔字符等将被删除。

如果不需要替换这些字符,请使用预定义的字符类:

 someString.replaceAll("[^\\p{IsAlphabetic}^\\p{IsDigit}]", "");

PS:\p{Alnum}没有达到此效果,它与[A-Za-z0-9]的行为相同。

答案 3 :(得分:48)

return value.replaceAll("[^A-Za-z0-9 ]", "");

这将保留空格。我认为这就是你想要的。否则,从正则表达式中删除空格。

答案 4 :(得分:21)

你也可以试试这个更简单的正则表达式:

 str = str.replaceAll("\\P{Alnum}", "");

答案 5 :(得分:10)

Java的正则表达式不要求你在正则表达式周围放置正斜杠(/)或任何其他分隔符,而不是像Perl等其他语言。

答案 6 :(得分:8)

我创建了这个创建文件名的方法:

public static String safeChar(String input)
{
    char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
    char[] charArray = input.toString().toCharArray();
    StringBuilder result = new StringBuilder();
    for (char c : charArray)
    {
        for (char a : allowed)
        {
            if(c==a) result.append(a);
        }
    }
    return result.toString();
}

答案 7 :(得分:3)

解决方案:

value.replaceAll("[^A-Za-z0-9]", "")

说明:

  

[^abc]   当尖号^作为方括号内的第一个字符出现时,它会否定该模式。此模式匹配除a或b或c以外的任何字符。

将关键字视为两个功能:

  • [(Pattern)] = match(Pattern)
  • [^(Pattern)] = notMatch(Pattern)

此外,关于模式:

  • A-Z = all characters included from A to Z

  • a-z = all characters included from a to z

  • 0=9 = all characters included from 0 to 9

因此它将替换模式中未包含的所有字符

答案 8 :(得分:1)

简单方法:

public boolean isBlank(String value) {
    return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}

public String normalizeOnlyLettersNumbers(String str) {
    if (!isBlank(str)) {
        return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
    } else {
        return "";
    }
}

答案 9 :(得分:1)

public static void main(String[] args) {
    String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";

    System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));

}

输出: ChlamydiasppIgGIgMIgAAbs8006

Github:https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java

答案 10 :(得分:1)

如果您还想允许不属于ascii字符集的字母数字字符,例如德语变音符号,您可以考虑使用以下解决方案:

 String value = "your value";

 // this could be placed as a static final constant, so the compiling is only done once
 Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);

 value = pattern.matcher(value).replaceAll("");

请注意,使用UNICODE_CHARACTER_CLASS标志可能会对性能造成影响(请参阅此标志的javadoc)

答案 11 :(得分:0)

使用番石榴,您可以轻松地组合不同类型的条件。对于您的特定解决方案,您可以使用:

NSNaturalTextAlignment

答案 12 :(得分:0)

番石榴的CharMatcher提供了一个简洁的解决方案:

output = CharMatcher.javaLetterOrDigit().retainFrom(input);