我们正在开展一个用知识库回答问题的研究项目。我们采用了数据集SimpleQuestions(https://research.fb.com/projects/babi/)。 我们将最新的freebase数据转储加载到Virtuoso,并查询实体' mids的名称(使用关系type.object.name和common.topic.alias)。然而,许多实体'找不到名字。
我们还使用Semper(https://github.com/percyliang/sempre)提供的KB,我们在其中找到更多实体'名字,但不是全部。 我们猜测这些实体可能会被删除,这是真的吗?如果是这样,我们如何继续解决这个问题?
答案 0 :(得分:1)
Freebase API已depreciated,无法获取实体名称。但是,Google为2.1M实体提供了Freebase/Wikidata Mappings。这些映射可用于将freebase实体映射到wikidata实体并获取它们的实体名称和其他信息。
此外,http://sameas.org/为freebase实体提供了一些额外的映射。
编辑: 您还可以阅读Freebase Dump以获取这些映射。我个人使用以下属性来获取相应的实体名称:
{{1}}
此外,即使在这样做之后,还有一个很好的数量(~1-5k,不记得确切)mids我们无法映射到名称,并且可以安全地删除那些(只有少数这样的) )问题。 Google还提供了一个额外的转储,其中包含一些已删除的元组。