正则表达式允许除了无效字符之外的每个字符

时间:2012-12-11 19:03:33

标签: java xml regex special-characters

我有一个问题,我想要一个正则表达式模式,允许每个字符,例如,字母,数字,特殊字符,变音字符但不是无效的字符,如箭头符号,这阻止我生成一个xml。请帮我解决这个问题,如何用空格替换无效字符。

我正在使用java 1.5

3 个答案:

答案 0 :(得分:2)

您可以使用character class并匹配所有有效字符

^[a-zA-Z\d]+$

但如果您不想允许某些字符,可以使用Negated character class

^[^><]+$
   --
    |->your arrow signs go here...

例如,regex之类的[^a-zA-Z]会匹配除字母

之外的任何字符

答案 1 :(得分:0)

replaceAll函数将采用RegEx:

String myUnparsedString = "<some-xml-style-node>";
String myParsedString = myUnparsedString.replaceAll("<", " ");

答案 2 :(得分:0)

您可以删除所有不需要的字符,例如箭头:

String cleanXML = xml.replaceAll("[^\u0000-\u00ff]+", " ");

只是将\x00-\xFF范围之外的1个或多个字符替换为空格。