Java正则表达式提取文本INSIDE标记

时间:2014-09-18 12:19:39

标签: java regex

我对Regex不太好(使用 JAVA ),我希望得到一些帮助,以获取标签内的文字<> 例如,文字:

Hello, my name is <NAME>, i'm <YEAR> years old, and i live in <ADRESS>

我需要一个字符串的ArrayList或array []: NAME,YEAR,ADRESS

1 个答案:

答案 0 :(得分:2)

使用<(\\w+)>的简单模式和匹配器将起作用。 PS:您需要使用matcher.group(1)来提取实际文本。

检查demo here 所以,这样的事情会起作用。

Pattern p = Pattern.compile("<(\\w+)>");
Matcher m = p.matcher();
while(m.find()){
// m.group(1) will give you values of name year and address(address is not returned completely if it is space delimited, you can use `<(.*?)>` to get entire address)
}