我这里有三个字符串。
第1行: 56,C0348 | 23064,C0319 | 23182,C0127 | 1476,C0378 | 2004,C0260 | 3306,C0091 | 23179,C0525 |
第2行:8966,T4992 | 4446,T4992 | 4445,E | 8965,E; T4992 | 8964,E; C0163 |
第3行:920,M128; C0323 |
现在,我的目标是删除形式为" Tnumber |"," Cnumber |" ," Mnumber |"。
例如,在第一行中,我想删除" C0348 |"," C0319 |"," C0127 |",&# 34; C0378 |"," C0260 |"," C0091 |"," C0525 |
在第二行,T4992 |,T4992,T4992 |,C0163 |
在第三行,M128; C0323 |
如何从每个字符串行中删除这些字符串?
我想我需要使用正则表达式,对吧? 但是,我仍然无法解决这个问题。
你能帮我吗?
答案 0 :(得分:2)
你可以像这样使用正则表达式
import java.util.regex.Pattern;
public class Test {
private static final String REGEX = "(T|M|C)\\d+(;|\\|)?";
private static final Pattern p = Pattern.compile(REGEX);
public static String filterer(String inputString) {
String result = "";
for(String s : p.split(inputString)) {
result += s;
}
return result;
}
public static void main(String[] args) {
System.out.println(filterer("56,C0348|23064,C0319|23182,C0127|1476,C0378|2004,C0260|3306,C0091|23179,C0525|"));
System.out.println(filterer("8966,T4992|4446,T4992|4445,E|8965,E;T4992|8964,E;C0163|"));
System.out.println(filterer("920,M128;C0323|"));
}
}
<强>输出强>
56,23064,23182,1476,2004,3306,23179,
8966,4446,4445,E|8965,E;8964,E;
920,
当然,我们可以使用像这样的字符类
,而不是拥有捕获组
答案 1 :(得分:1)
您可以尝试[TCM]\d+[\|;]
,http://regexr.com/v1?38ls3的正则表达式。并作为java源:
String reg= "[TCM]\\d+[\\|;]";
String line = "56,C0348|23064,C0319|23182,C0127|1476,C0378|2004,C0260|3306,C0091|23179,C0525|";
line = line.replaceAll(reg, "");
System.out.println(line);
line = "8966,T4992|4446,T4992|4445,E|8965,E;T4992|8964,E;C0163|";
line = line.replaceAll(reg, "");
System.out.println(line);
line = "920,M128;C0323|";
line = line.replaceAll(reg, "");
System.out.println(line);
输出:
56,23064,23182,1476,2004,3306,23179,
8966,4446,4445,E|8965,E;8964,E;
920,
答案 2 :(得分:0)
因为这些是逗号分隔值,您可以将它们拆分为
String arr[] = line.split (",");
// iterate over them
int index = arr[0].indexOf ("|");
if (index != -1) {
// do substring
}