我需要在RDF文件中找到给定主题的“主要类型”
当我在http://www.freebase.com上的搜索框中输入问题时,自动完成功能会使用此“主要类型”为我指定主题的名称。
例如:
如何在RDF表示中找到这个“主要类型”?
感谢您的帮助。
答案 0 :(得分:1)
值得注意的类型尚未包含在RDF转储中。谷歌已表示他们将会,但尚未提供时间表。
答案 1 :(得分:0)
大概你可以相当松散地定义“主要类型”,即你不是太担心确切的上下文匹配而只是想要“最受欢迎”的选项?
假设您可以编写和运行SPARQL查询,最好的方法是运行查询,找到文本匹配文本以自动完成,并查找与之相关的最常用术语。
SELECT ?term (COUNT(*) AS ?triples)
{
?term ?property ?value .
FILTER(REGEX(?value, "Barack Oba", "i"))
} GROUP BY ?term ORDER BY DESC(?triples) LIMIT 1
请注意,在此处使用REGEX
会严重影响性能,具体取决于底层的SPARQL实现,可能有更有效的方法来执行此类文本搜索查询。