方法Pattern.compile()上的正则表达式

时间:2017-12-05 12:28:40

标签: java regex parsing matcher

我必须创建一个正则表达式以放入Pattern.compile(regex)方法; 我的正则表达式必须允许整数(在数字的开头没有0),一系列数字和字符(A-Za-z),但问题是第三点:一个必须以char&开头和结尾的字符串#39; " ',必须避免使用字符反斜杠(除非没有另外一个反斜杠)和char''' (除非有反斜杠之前)

但我不明白如何做第二点(我遇到了很多错误),这是我的java代码:

public static void main(String[] args) {
    if (args.length == 0)
        throw new IllegalArgumentException();
    Matcher matcher = Pattern.compile("([a-zA-Z]+[0-9a-zA-Z_]*)|"
            + "(0(?![0-9])|([1-9]+)([0-9]*))|" //"?!" è una asserzione : " se la condizione tra parentesi è vera non considerare lo zero
            + "([\"]{1}(([\\\\][^\"\\][\\\"])*)[\"]{1})" 
            + "|(\\s+)").matcher(args[0]);// \s = [ \t\n\x0B\f\r]
    System.out.println("Input: " + args[0]); //println va a capo dopo la stampa
    while (matcher.lookingAt()) {
        System.out.print("Lexeme '" + matcher.group() + "'"); //non va a capo dopo la stampa
        System.out.println(" group " + ExampleLexer.getGroup(matcher));
        matcher.region(matcher.end(), matcher.regionEnd());
    }

     //attenzione: matcher.hitEnd() restituisce true se il matcher arriva in fondo
     //all'input anche se l'ultimo match non ha avuto successo, quindi funziona solo
     //per espressioni regolari "semplici"
    if (matcher.regionStart() == matcher.regionEnd())
        System.out.println("All lexems succesfully matched");
    else {
        System.err.print("Unmatched lexem ");
        matcher.usePattern(Pattern.compile(".*"));
        matcher.lookingAt();
        System.err.println(matcher.group());
    }
}

1 个答案:

答案 0 :(得分:0)

value
  • 引用
  • 零次或多次"\"(\\\\.|[^\"\\\\])*\"" // (1) "\"(\\\\[\"\\\\]|[^\"\\\\])*\"" // (2) ... (
    • 反斜杠)*后跟(1)任何char \ /(2)任何非引用/非反斜杠
    • .不是引用,不是反斜杠| ... [^
  • quote

逃脱:

  1. ]是一个String转义符,表示一个char,双引号。
  2. \"是表示反斜杠的字符串转义符,一个字符。
  3. \\是正则表达式转义\\\\来表示反斜杠本身而不是正则表达式转义序列本身。
  4. 如果你想要替换反斜杠,首先尝试没有正则表达式:\\每个反斜杠加倍。猜猜如何使用s = s.replace("\\", "\\\\");在正则表达式中编写它。