用于字符串模式拆分的正则表达式

时间:2015-05-31 21:55:59

标签: java

有一个场景可以删除下面的模式字符串 -

abc|hjdj|kleygag|0|0|0|0|
ghys|jkugb|0|0|0
yuubf|kluygb|tyrffv|nutgv|0|0|0|0|0|

寻求帮助获取java中的正则表达式以分隔这些值,排除从0之前的第一个管道出现的所有内容,输出应该看起来像 -

abc|hjdj|kleygag
ghyd|jkugb
yuubf|kluygb|tyrffv|nutgv

只需要正则表达式,已经得到回答并且非常有帮助,只是非常有助于了解正则表达式而不是后续问题中所要求的反向模式的完整代码

2 个答案:

答案 0 :(得分:0)

你可以使用这样的正则表达式:

\|0|0\||\|$

Java代码:

String regex = "\\|0|0\\|\\|$";

System.out.println("abc|hjdj|kleygag|0|0|0|0|".replaceAll(regex, ""));
System.out.println("ghys|jkugb|0|0|0".replaceAll(regex, ""));
System.out.println("yuubf|kluygb|tyrffv|nutgv|0|0|0|0|0|".replaceAll(regex, ""));

答案 1 :(得分:0)

这需要正则表达式吗? substring()让你想要的很容易。

更新

我看到了一条评论,你也想要一个数据看起来像“0 | 0 | 0 | 0 | abdc | ghyft | rtyu”的情况。我已经修改了我对这种情况的回答以及数据可能的情况,“0 | 0 | 0 | 0 | abdc | ghyft | rtyu | 0 | 0 | 0 |”

无论哪种方式:

public static void main(String[] args) throws Exception {
    List<String> strings = new ArrayList(){
        {
            add("abc|hjdj|kleygag|0|0|0|0|");
            add("ghys|jkugb|0|0|0");
            add("yuubf|kluygb|tyrffv|nutgv|0|0|0|0|0|");
            add("0|0|0|0|abdc|ghyft|rtyu");
            add("0|0|0|0|abdc|ghyft|rtyu|0|0|0|0|0|");
        }
    };

    // Non Regex
    System.out.println("Non Regex");
    for (String string : strings) {
        int startIndex = -1;
        int endIndex = -1;
        // Find first non zero character
        for (int i = 0; i < string.length(); i++) {
            if ('a' <= string.charAt(i) && string.charAt(i) <= 'z') {
                startIndex = i;
                break;
            }
        }
        // Find first pipe zero |0 after startIndex
        endIndex = string.indexOf("|0", startIndex);

        // Determine which substring() to use based on the endIndex results
        System.out.println(endIndex > -1 ? string.substring(startIndex, endIndex) : string.substring(startIndex));
    }
    System.out.println("");

    // Regex
    System.out.println("Regex");
    for (String string : strings) {
        System.out.println(string.replaceAll("\\|0|0\\||\\|$", ""));
    }
}

结果:

非正则表达式

abc|hjdj|kleygag
ghys|jkugb
yuubf|kluygb|tyrffv|nutgv
abdc|ghyft|rtyu
abdc|ghyft|rtyu

Regex
abc|hjdj|kleygag
ghys|jkugb
yuubf|kluygb|tyrffv|nutgv
abdc|ghyft|rtyu
abdc|ghyft|rtyu