在我正在开发的应用程序中,我需要知道一串单词是否是名词短语,动词短语等。我知道NP和VP既不是依赖也不是POS。我也明白,要做到这一点,我可能需要某种分块工具,但我找不到任何开源工具。
在SyntaxNet的输出中,句子“她真的很喜欢可爱的黑狗”:
likes VBZ ROOT
+-- She PRP nsubj
+-- really RB advmod
+-- dog NN dobj
+-- cute JJ amod
+-- black JJ amor
我注意到NP“可爱的黑狗”已被放入其自己的树节点中:
+-- dog NN dobj
+-- cute JJ amod
+-- black JJ amor
所以我想知道无论如何我都可以使用SyntaxNet作为chunker?
答案 0 :(得分:1)
老实说,那里有准确的快速分块(如NLTK),我不知道为什么要使用依赖分析树来提取块。
虽然您可以查看this google sample code(这不提供块,但主题,对象和动词)可能对您的应用程序有用,并为您提供一些线索,以便如何定义正则表达式来提取大部分名词短语。