Java-提取方括号内的内容(忽略嵌套方括号)?

时间:2019-05-17 13:16:47

标签: java regex string parsing brackets

我想提取方括号内的字符串内容(如果一个方括号内包含嵌套的方括号应将其忽略)。

示例:

c[ts[0],99:99,99:99] + 5 - d[ts[1],99:99,99:99, ts[2]] + 5

应返回:

 match1 = "ts[0],99:99,99:99";
 match2 = "ts[1],99:99,99:99, ts[2]";

到目前为止,我的代码仅适用于非嵌套方括号

String in = "c[ts[0],99:99,99:99] + 5 - d[ts[1],99:99,99:99, ts[2]] + 5";

Pattern p = Pattern.compile("\\[(.*?)\\]");
Matcher m = p.matcher(in);

while(m.find()) {
    System.out.println(m.group(1));
}

// print: ts[0, ts[1, 2

4 个答案:

答案 0 :(得分:2)

我创建了一个函数来执行此操作(不是使用正则表达式,但是它可以工作)

  for (int i = 0; i < in.length(); i++){
        char c = in.charAt(i);
        String part = String.valueOf(c);
        int numberOfOpenBrackets = 0;
        if (c == '[') {
            part = "";
            numberOfOpenBrackets++;
            for (int j = i + 1; j < in.length(); j++) {
                char d = in.charAt(j);
                if (d == '[') {
                    numberOfOpenBrackets++;
                }
                if (d == ']') {
                    numberOfOpenBrackets--;
                    i = j;
                    if (numberOfOpenBrackets == 0) {
                        break;
                    }
                }
                part += d;
            }

            System.out.println(part);
            part = "[" + part + "]";
        }

        result += part;
    }

    // print: ts[0],99:99,99:99
    //        ts[1],99:99,99:99, ts[2]

答案 1 :(得分:2)

如果嵌套只是一个级别,则可以搜索方括号之间的序列:

  • 一系列:
  • 不是[
  • [,后跟最短序列到]

所以

Pattern p = Pattern.compile("\\[([^\\[]|\\[.*?\\])*\\]");
//                             [                   ]
//                              ( not-[ or
//                                        [, shortest sequence to ]
//                                               )* repeatedly

问题在于必须正确配对方括号:不允许语法错误。

答案 2 :(得分:1)

您可能想在表达式中添加一个右边界,然后ts开始并在其之间滑动所有内容,这可能会起作用,也许类似于this expression

(ts.*?)(\]\s+\+)

如果这里还有更多的字符:(\s\+),您可以在字符列表中简单地添加带有逻辑或的字符,它仍然可以使用。

RegEx

如果这不是您想要的表达式,则可以在regex101.com中修改/更改表达式。 enter image description here

RegEx电路

您还可以在jex.im中可视化您的表达式:

enter image description here

答案 3 :(得分:1)

没有正则表达式;只是笔直的Java:

import java.util.ArrayList;
import java.util.List;

public class BracketParser {

    public static List<String> parse(String target) throws Exception {
        List<String> results = new ArrayList<>();
        for (int idx = 0; idx < target.length(); idx++) {
            if (target.charAt(idx) == '[') {
                String result = readResult(target, idx + 1);
                if (result == null) throw new Exception();
                results.add(result);
                idx += result.length() + 1;
            }
        }
        return results;
    }

    private static String readResult(String target, int startIdx) {
        int openBrackets = 0;
        for (int idx = startIdx; idx < target.length(); idx++) {
            char c = target.charAt(idx);
            if (openBrackets == 0 && c == ']')
                return target.substring(startIdx, idx); 
            if (c == '[') openBrackets++;
            if (c == ']') openBrackets--;
        }
        return null;
    }

    public static void main(String[] args) throws Exception {
        System.out.println(parse("c[ts[0],99:99,99:99] + 5 - d[ts[1],99:99,99:99, ts[2]] + 5"));
    }
}