从对应于主要动词的句子中提取短语n-gram

时间:2016-06-13 10:44:22

标签: python graph nlp stanford-nlp

我正在研究一个需要我提取句子之间相似性的项目。因此,给定一个句子,我需要该句子的短语n-gram,它是“主要动词和动词左右的名词短语的组合”。知道如何提取这个吗?我得到了依赖和选区解析句子的树。我正在使用Python。

Sample Sentence: My dog also likes eating sausage.
Constituency Parse Tree:
ROOT
(S
    (NP (PRP$ My) (NN dog))
    (ADVP (RB also))
    (VP (VBZ likes)
      (S
        (VP (VBG eating)
          (NP (NN sausage)))))
    (. .)))

Dependency Graph:
nmod:poss(dog-2, My-1)
nsubj(likes-4, dog-2)
advmod(likes-4, also-3)
root(ROOT-0, likes-4)
xcomp(likes-4, eating-5)
dobj(eating-5, sausage-6)

主要动词:喜欢

左名词短语(NP):我的狗

Right Noun Phrase:香肠。

1 个答案:

答案 0 :(得分:0)

你试过Stanford OpenIE吗?或者,就此而言,任何OpenIE系统(Ollie / ReVerb /等。)。

最低使用率(通过Simple CoreNLP):

new Sentence("My dog also likes eating sausage.").openieTriples();

管道/服务器使用情况:

创建CoreNLP管道,并将注释器设置为tokenize,ssplit,pos,lemma,depparse,natlog,openie。然后,应该在句子的RelationTripleAnnotation.class键上键入Open IE三元组。

corenlp.run

上试用