我面临同样的问题 Stanford CoreNLP OpenIE annotator 我尝试输出= nlp.annotate(s,properties = {" annotators":" tokenize,ssplit,pos,depparse,natlog,openie"," outputFormat": " json"," openie.triple.strict":" true"," openie.max_entailments_per_clause":" 1" " openie.splitter.disable":"真"})
但我仍然有4个条款
(u'是从',' 20%的电动机',u'装配线')(u'是从',& #39;百分比电动机',u'装配线')(你',你'百分之二十的电动机',你'拉' )(你是',你'%电动机',你'拉') 我做错了吗?如何获得精确的三重奏 ('是从',' 20%的电动机','装配线')
答案 0 :(得分:1)
这实际上是预期的行为。在OpenIE系统中,设计决定生成所有三元组,这些三元组在逻辑上都是由原始句子引起的,即使它们是多余的。想法是这些三元组通常用于类似于IR-ish查找的东西,并且在这些情况下,不必对三元组是否与查询“足够相似”进行模糊匹配是方便的。