从零开始,依赖关系的起始位置是ROOT。
在 pattern.en 中,同一动词被标记为VP。如果有多个副总裁,您怎么知道哪个是ROOT? 是否总是标有“ -1”的那个?
: pattern.en.parse('John hit the ball', relations=True)
: u'John/NNP/B-NP/O/NP-SBJ-1 hit/VBD/B-VP/O/VP-1 the/DT/B-NP/O/NP-OBJ-1 ball/NN/I-NP/O/NP-OBJ-1'
: doc = nlp(u'John hit the ball')
: [ (t.text, t.dep_) for t in doc ]
: [(u'John', u'nsubj'), (u'hit', u'ROOT'), (u'the', u'det'), (u'ball', u'dobj')]
如何处理多个OBJ和SUBJ?