如何使用正则表达式从树结构中提取单词

时间:2013-02-07 13:37:04

标签: java regex regular-language

我需要从树结构中提取名词短语,但我无法使用正则表达式从树结构中提取名词。

这是树结构

(TOP(ADJP(JJ welcome)(PP(TO to)(NP(NNP Regular)(NNP表达)(NNS学习)))))

我需要提取所有像NP,NNP,NNS等pos标签的单词。我需要使用正则表达式,表达式,使用正则表达式模式进行学习。

有人可以帮我解决这个问题。

1 个答案:

答案 0 :(得分:1)

不确定这是否是您想要的,但这会为您提取这些字词:

Pattern regexpPattern = Pattern.compile("([A-Z]?[a-z]+)\\)");
Matcher m = regexpPattern.matcher("your string");
while (m.find()) {
    System.out.println(m.group(1));
}