如何在正则表达式中识别两个没有空格的标记?

时间:2019-03-30 20:17:06

标签: java regex

例如,我要匹配字符串中的两个标记,例如,我想识别(x),例如specialCharacter :(,变量:x,specialCharacter:)。

但是我的Regex只识别字符串中的第一个标记:specialCharacter:(x)

这是我的正则表达式:

SpecialCharacters("[{|}|(|)|@|&|'|/||`|~|?|:|;]\\s?"),
Variables("\\w")

这是我的Java代码:

package lexer;

import java.util.ArrayList;
import java.util.StringTokenizer;
import java.util.regex.Pattern;
import java.util.regex.Matcher;

public class Lexer{


final ArrayList<Reservada> rs = new ArrayList<Reservada>(); // atributo de mi clase lexer que contendra un arraylist de instancias de Reservada aqui
//sabre cuantos tipos de tokens tengo.


public ArrayList<Token> lex(String entrada){
    final ArrayList<Token> tokens = new ArrayList<Token>(); //arraylist de tokens
    final StringTokenizer st = new StringTokenizer(entrada); // mi tokenizer que tendra el codigo que se pasa como parametro a entrada

    while(st.hasMoreTokens()){

        String palabra = st.nextToken(); //mi palabra es igual a el siguiente token

        boolean matched = false; //mi bandera de encuentra o relacionado la pongo en falso

        int i=0;   // creo una variable i y le asigno 0 esto lo hago para controlar que no haya dos tokens iguales pero relacionados con dos tipos diferentes

        for(Tipos tokenTipo: Tipos.values()){ // recorro todos mis tipos hasta allar el que corresponda a mi palabra



            Pattern patron = Pattern.compile(tokenTipo.patron);
            Matcher matcher = patron.matcher(palabra);

            if(matcher.find()){ // si se encuentra pues hahcemos el proceso de agregar el tipo al token , el valor y inicializar o aumentar al contador de tipos
                i++;
                System.out.println(palabra);

                if(i<=1) { //condicional para que no se repita el token con diferentes tipos
                    boolean ok=true;
                    Token tk = new Token();


                    tk.setTipo(tokenTipo);
                    tk.setValor(palabra);
                    tokens.add(tk);

                    //checo si mi arraylist esta vacio si no es asi recorro todo para saber cual se repite y agregarle al contador uno mas de ese tipo
                    //pongo mi bandera en false si no existe la palabra reservada pues mi bandera ase queda en true asi que creo una instancia de Reservada y la agrego
                    // a mi arraylist

                    if(rs.isEmpty()){
                        Reservada r = new Reservada(tk.getTipo().toString());
                        rs.add(r);
                    }else{
                        for(Reservada x:rs){

                            if(x.reservada.equals(tk.getTipo().toString())){

                                x.size++;
                                ok=false;
                            }
                        }
                        if(ok==true){
                            Reservada r = new Reservada(tk.getTipo().toString());
                            rs.add(r);
                        }

                    }
                    matched=true;
                    System.out.println(i);

                }
            }
            if(!matched){
                //   throw new RuntimeException("No existe tal token");
            }

        }

    }

    return tokens; //regreso mi arraylist de tokens.
}
}

我想将字符串(x)分为三类。任何想法?

1 个答案:

答案 0 :(得分:0)

解决了我创建新正则表达式的问题:

decodeWeelWithOffsetXY

,然后使用Scanner的方法useDelimiter

"((?<=[\\(|\\)|\\s+|\\{|\\}|\\+|\\-|\\/|//*])|(?=[\\(|\\)|\\s+|\\{|\\}|\\+|\\-|\\/|//*]))"