如何在freebase RDF中找到给定主题的“主要”类型?

时间:2013-04-29 15:35:16

标签: rdf freebase


我需要在RDF文件中找到给定主题的“主要类型” 当我在http://www.freebase.com上的搜索框中输入问题时,自动完成功能会使用此“主要类型”为我指定主题的名称。
例如:

  1. 当我写“巴拉克奥巴”时,我可以看到“巴拉克奥巴马 - 美国总统”。 主题“巴拉克奥巴马”有很多类型,但我怎么能在RDF中找到 该专业是“美国总统”的文件?
  2. 相似“Woody Allen”=> “的编剧
  3. “EOS 400D”=> “数码相机
  4. 如何在RDF表示中找到这个“主要类型”?

    感谢您的帮助。

2 个答案:

答案 0 :(得分:1)

值得注意的类型尚未包含在RDF转储中。谷歌已表示他们将会,但尚未提供时间表。

答案 1 :(得分:0)

大概你可以相当松散地定义“主要类型”,即你不是太担心确切的上下文匹配而只是想要“最受欢迎”的选项?

假设您可以编写和运行SPARQL查询,最好的方法是运行查询,找到文本匹配文本以自动完成,并查找与之相关的最常用术语。

SELECT ?term (COUNT(*) AS ?triples)
{
  ?term ?property ?value .
  FILTER(REGEX(?value, "Barack Oba", "i"))
} GROUP BY ?term ORDER BY DESC(?triples) LIMIT 1

请注意,在此处使用REGEX会严重影响性能,具体取决于底层的SPARQL实现,可能有更有效的方法来执行此类文本搜索查询。