使用SyntaxNet进行分块?

时间:2016-08-04 12:30:24

标签: machine-learning nlp syntaxnet

在我正在开发的应用程序中,我需要知道一串单词是否是名词短语,动词短语等。我知道NP和VP既不是依赖也不是POS。我也明白,要做到这一点,我可能需要某种分块工具,但我找不到任何开源工具。

在SyntaxNet的输出中,句子“她真的很喜欢可爱的黑狗”:

likes VBZ ROOT
 +-- She PRP nsubj
 +-- really RB advmod
 +-- dog NN dobj
     +-- cute JJ amod
     +-- black JJ amor

我注意到NP“可爱的黑狗”已被放入其自己的树节点中:

 +-- dog NN dobj
     +-- cute JJ amod
     +-- black JJ amor

所以我想知道无论如何我都可以使用SyntaxNet作为chunker?

1 个答案:

答案 0 :(得分:1)

老实说,那里有准确的快速分块(如NLTK),我不知道为什么要使用依赖分析树来提取块。

虽然您可以查看this google sample code(这不提供块,但主题,对象和动词)可能对您的应用程序有用,并为您提供一些线索,以便如何定义正则表达式来提取大部分名词短语。