在java中提取已知模式的子字符串

时间:2018-06-14 20:52:26

标签: java string substring extract

我正在处理包含我想要提取的子字符串的字符串。子字符串的格式始终为" USX",其中US是字符串" US",X是任意长度的整数。

例如,请考虑以下字符串:

  • " US21"
  • " US9432"
  • " US121390"
  • " US7"

对于以下字符串,我想以粗体提取文本。

  

str1 = somerandomstuff 129 moreRand US2 $#@#o

     

str2 = US231 随机!@@!

     

str3 = apples或@ nges 12 US1294

我一直在寻找一种方法来做到这一点,但没有成功。关于我如何能够解决这个问题的任何想法?

3 个答案:

答案 0 :(得分:4)

您可以使用正则表达式来实现它。使用正则表达式(US\\d+),您将获得与“US”匹配的组,后跟一个任意长度的整数(最小值为1)

import java.util.regex.Matcher;
import java.util.regex.Pattern;

...

Matcher matcher = Pattern.compile("(US\\d+)").matcher(str1);
if (matcher.find()) {// if it matched the pattern
    String result = matcher.group(0);// the group captured by the regex
}

答案 1 :(得分:0)

如果你想要的所有字符串都用上面的空格分隔,你可以使用split()。

例如,

String[] strArray1 = str1.split(" ");
for (String item : strArray1) { // Cycle through all the pieces
    if (item.startsWith("US"))
         String target = item; // Your desired String
}

Split()将一个字符串分解为一个数组,每个元素都是分隔符之间的任何东西,在这种情况下是空格。

答案 2 :(得分:-1)

您可以使用正则表达式(简称正则表达式)来解决此类问题。

我喜欢的正则表达式的一个来源是https://www.regular-expressions.info/