我正在使用Stanford CoreNLP来获取句子的依赖树。 我遇到的问题是,对于某些句子,树没有根节点。这可能吗?
Here,有一个类似的例子,其中检测到问题与print方法有关(即有一个根,但不知何故它没有被打印)。
但是,在我的情况下,句子根本没有根。这是我的测试句子:“(Wendigo是)为什么我们去看电影:通过眼睛,心脏,心灵喂养。”
我正在使用以下代码打印依赖项:
SemanticGraph dependencies = sentence.get(CollapsedCCProcessedDependenciesAnnotation.class);
out.println(dependencies.toString("plain"));
这是输出:
nsubj(-RRB--4, Wendigo-2)
cop(-RRB--4, is-3)
advmod(go-7, why-5)
nsubj(go-7, we-6)
advcl(-RRB--4, go-7)
det(cinema-10, the-9)
prep_to(go-7, cinema-10)
aux(fed-14, to-12)
auxpass(fed-14, be-13)
parataxis(go-7, fed-14)
det(eye-17, the-16)
prep_through(fed-14, eye-17)
det(heart-20, the-19)
appos(eye-17, heart-20)
det(mind-23, the-22)
appos(heart-20, mind-23)
尝试手动打印根节点后,使用以下代码:
IndexedWord root = dependencies.getFirstRoot();
out.printf("ROOT(root-0, %s-%d)%n", root.word(), root.index());
我收到以下错误消息:
Exception in thread "main" java.lang.RuntimeException: No roots in graph:
dep reln gov
--- ---- ---
Wendigo-2 nsubj -RRB--4
is-3 cop -RRB--4
why-5 advmod go-7
we-6 nsubj go-7
go-7 advcl -RRB--4
the-9 det cinema-10
cinema-10 prep_to go-7
to-12 aux fed-14
be-13 auxpass fed-14
fed-14 parataxis go-7
the-16 det eye-17
eye-17 prep_through fed-14
the-19 det heart-20
heart-20 appos eye-17
the-22 det mind-23
mind-23 appos heart-20
Find where this graph was created and make sure you're adding roots.
问题是:
谢谢,
答案 0 :(得分:5)
看起来这是一个由解析器错误地生成一个形容词短语成分而导致的错误,该成分只包含右括号,它发送了依赖关系(右括号成了一个调控器,但随后被删除为标点符号)。
有人似乎已经解决了这个问题。当前版本(在github中)给出了下面的依赖项。因此,我们本周发布的新版本(2015年4月)应该有希望为您解决问题....
root(ROOT-0, is-3)
nsubj(is-3, Wendigo-2)
advmod(go-7, why-5)
nsubj(go-7, we-6)
advcl(is-3, go-7)
case(cinema-10, to-8)
det(cinema-10, the-9)
nmod:to(go-7, cinema-10)
mark(fed-14, to-12)
auxpass(fed-14, be-13)
parataxis(go-7, fed-14)
case(eye-17, through-15)
det(eye-17, the-16)
nmod:through(fed-14, eye-17)
det(heart-20, the-19)
appos(eye-17, heart-20)
det(mind-23, the-22)
appos(heart-20, mind-23)