使用freebase命名实体识别

时间:2013-12-27 06:55:10

标签: freebase dbpedia spotlight-dbpedia

我理解DBPedia聚光灯对给定文档进行了命名实体识别。为此,它使用存储在文件系统中的下载的DBPedia文件。请注意URL:https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR

我需要的是一个等效的API,如Freebase的聚光灯。就像我浏览的那样,我找不到任何在Freebase三元店上运行的工具/ API。有人可以帮忙吗?

1 个答案:

答案 0 :(得分:3)

目前在Freebase中没有用于命名实体识别的等效项目。但是,Freebase在sameAs.org上有指向DBpedia的链接,因此您可以使用DBpedia聚焦,然后将ID解析回Freebase(Freebase RDF dumps中也提供了这些数据)。

如果您正在寻找此领域的编码项目,我认为应该可以调整DBpedia Spotlight代码,以便您可以使用Freebase数据训练其模型。这样做的主要好处是Freebase涵盖了比DBpedia更广泛的实体,因此您可以更好地回忆起来。此外,您可以利用Freebase中的其他数据,如“值得注意的类型”,以获得更好的精度。

通过查看Freebase中的/ type / object / name和/ common / topic / alias属性,您应该能够获得一组好的实体“表面形式”。对应于Wikpedia页面的任何Freebase实体将在/ wikipedia / en名称空间中具有一个或多个/ type / object / key值。这些对应于Wikipedia页面名称(和重定向),它们允许您解析Wikipedia XML转储并识别页面上哪些链接与Freebase主题相对应。 Freebase密钥编码方案描述为here

您可能还对OpenCalaisAlchemyAPI感兴趣,它们将命名实体识别作为服务提供,并在其API响应中提供Freebase ID。