我正在尝试使用CoreNLP测试/运行Stanford OpenIE程序。
http://nlp.stanford.edu/software/openie.html
http://stanfordnlp.github.io/CoreNLP/openie.html
这是我的命令:java -mx1g -cp stanford-corenlp-3.6.0.jar;stanford-corenlp-3.6.0-models.jar;CoreNLP-to-HTML.xsl;slf4j-api.jar;slf4j-simple.jar edu.stanford.nlp.naturalli.OpenIE
我的输入文件包含以下文字:
Born in Honolulu, Hawaii, Obama is a US Citizen.
Born in a small town, she took the midnight train going anywhere.
我得到以下输出:
1.0 Obama is US Citizen
1.0 she Born in small town
1.0 she Born in town
根据Angeli等人撰写的题为“利用开放域信息提取的语言结构”的论文中提到的例子,我期待更多三元组,如(Obama; born in; Honolulu, Hawaii)
和(She; took; midnight train)
。为什么输出不完整?
此外,在OpenIE实现中使用了什么类型的依赖解析?
谢谢!
答案 0 :(得分:0)
这些是依赖关系解析中的错误。在论文发表之后,我们转向了Universal Dependencies,它大大改变了底层解析器。您可以在http://corenlp.run
的句子旁边看到OpenIE在第一种情况下,从“公民”到“出生”的dep
弧是不正确的。在第二种情况下,从“接”到“走”的ccomp
边缘引起问题。在旧的表示中,这是从“接受”到“火车”的vmod
。您可以尝试以下方法:
Born in Honolulu, Obama is a US Citizen.
Born in a small town, she took the midnight train.