树是使用python包装器py-corenlp的斯坦福核心NLP库(用Java编写)的输出。我想从中提取NP。这就是为什么我要穿过树。
我尝试在python中使用ete3;但没有运气。它给出了错误: NewickError:不存在的树文件或格式错误的newick树结构。 您可能要检查其他newick加载标志,例如“格式”或“ quoted_node_names”。
print(输出['句子'] [0] ['分析']) (根 (S (NP(NNP Pusheen) (抄送和) (NNP Smitha)) (副总裁(VBD走了) (PP(沿) (NP(DT the)(NN海滩))) (。。)))
这是我要在python3中遍历的树。
我要提取NP,即名词短语;因此输出应类似于(Pusheen和Smitha),(海滩)。