我正在使用java来拆分表单的字符串:
String stringToSplit = "AAA BBB CCC DDD EEE FFF GGG HHH III JJJ KKK";
我正在使用
String[] tokens = stringToParse.split("\\s");
沿着空格分割字符串,给出:
tokens = {"AAA","BBB","CCC", "DDD","EEE","FFF","GGG","HHH","III", "JJJ", "KKK"}
我现在需要做的是在大多数情况下按空白划分,但在特定情况下也要保留一些字符串。例如,我希望“CCC DDD”和“III JJJ KKK”在我拆分时保持完整的字符串。所以我希望我的令牌数组是:
tokens = {"AAA","BBB","CCC DDD","EEE","FFF","GGG","HHH","III JJJ KKK"}
我会使用什么正则表达式?这可能吗?
答案 0 :(得分:6)
你可以用ccc_ddd替换ccc ddd,然后稍后将下划线转换回空格。
如果你要做很多这样的事情,你可能想投资某种语法解析器
答案 1 :(得分:3)
您可以使用以下方法找到所有连续的非空白字符,而不是使用split()
,但是使用替换也可以匹配包含空格的特定目标字符串:
Pattern p = Pattern.compile("CCC DDD|III JJJ KKK|\\S+");
Matcher m = p.matcher("AAA BBB CCC DDD EEE FFF GGG HHH III JJJ KKK");
while(m.find()) {
System.out.println(m.group());
}