在Open information extraction from the web的第3页,Banko等人描述了一种用于关系提取的自我监督分类器,它可以查看名词短语之间的潜在关系。他们说如果连接两个名词短语的单词序列不符合某些标准,则该关系被标记为"否定。"如果单词序列符合所有标准,则将其标记为正数。
他们列出的标准之一是:
Ei和Ej之间存在依赖链,不再存在 比一定长度。
他们在这里谈论什么?什么是依赖链?你如何识别依赖链?
答案 0 :(得分:0)
在这种情况下,“依赖链”似乎只是两个实体之间的单词长度/数量。 (比尔和鲍勃)
“比尔”“看到了”“鲍勃” “锯”是长度为1的链条 “比尔”“跳进车里,吃完饭后开走了”“午餐” “跳进他的车,吃完后开走了”很长(9)并没有很好的关系。“Bob”“与”Bill“结婚 “已婚”是该计划所寻求的关系类型。请记住,它会尝试自动自动。然后,通过良好的关系组合,尝试找出新的知识。
IF x“is-married-to”y AND z“is-son-of”x THEN z“is-the-son-of”y