我需要从树结构中提取名词短语,但我无法使用正则表达式从树结构中提取名词。
这是树结构
(TOP(ADJP(JJ welcome)(PP(TO to)(NP(NNP Regular)(NNP表达)(NNS学习)))))
我需要提取所有像NP,NNP,NNS等pos标签的单词。我需要使用正则表达式,表达式,使用正则表达式模式进行学习。
有人可以帮我解决这个问题。
答案 0 :(得分:1)
不确定这是否是您想要的,但这会为您提取这些字词:
Pattern regexpPattern = Pattern.compile("([A-Z]?[a-z]+)\\)");
Matcher m = regexpPattern.matcher("your string");
while (m.find()) {
System.out.println(m.group(1));
}