Freebase中“等效网页”的含义是什么?

时间:2015-06-03 13:56:50

标签: webpage freebase

我开始研究Freebase。我对网页有些困惑:

在以下link中,他们将等效网页描述为外部网页的链接。这些外页是维基百科页面和Freebase页面,IMDb页面等。

“外页”是什么意思?我不明白,外面到底究竟是什么?它在实体之外吗?

Barack Obama的外部网页是:

  

这些页面对“巴拉克奥巴马”来说是独一无二的吗?我们不能将它们视为唯一标识符。

这些实体是“巴拉克奥巴马”出现的页面吗?

2 个答案:

答案 0 :(得分:1)

这个答案可能含糊不清,因为我没有freebase的副本。根据您提供的链接,虽然它们似乎是以某种方式用作Topic Equivalent Webpage属性的值的链接/ uris。 topic_equivalent_webpage有一个描述:

  

描述主题的焦点奇特的网页。 (即仅与主题有关的页面。)

所以这就是它们 - 它们只有一个焦点,描述主题(在这种情况下是巴拉克奥巴马),并且可以来自网络上的任何地方。我不确定freebase中的误报,所以我会谨慎地将它们视为该主题的唯一标识符。我觉得这些更像是语义Web术语中的rdfs:seeAlso值,而不是等效/相同的实体。您可以在KB中运行一些检查:

  1. 您可以检查这些页面与Barack Obama实体之间是否存在owl:sameAs链接。在这种情况下,你可以认为它们在绝对意义上是等价的(例如关于巴拉克奥巴马所宣称的任何东西都可以传播并持有“等价”实体/页面)。同样,在您的KB / freebase的上下文中。

  2. 假设这些是topic_equivalent_webpage属性的值,您可以检查该属性是否与rdfs:subPropertyOf具有owl:equivalentPropertyowl:sameAs关系。在这种情况下,您的知识库认为它们是等效的。

答案 1 :(得分:1)

绝大多数可被视为强标识符。您可以通过查看“密钥”选项卡https://www.freebase.com/m/02mjmr?keys=

来确定哪些内容

这是Freebase最大的优势之一,这些丰富的协调实体标识符适用于各种不同的外部信息源(维基百科,IMDB,MusicBrainz,国会图书馆等)。

每个密钥都与一个名称空间相关联,每个名称空间都是唯一的,每个名称空间都有一个关联的URI模板,用于从密钥构造URI。例如,国会Bioguide URL与美国国会图书馆控制的名称空间相关联,并填充了用于识别立法者的THOMAS ID。

Freebase用户可以(或者可能)添加其他完全形成的URL,但很少发生。但是,如果您使用密钥,则可以保证只获得强标识符,而不是随机URL。

编辑:这是他们在批量Freebase RDF转储中的样子:

<http://rdf.freebase.com/ns/m.010q36>   <http://rdf.freebase.com/ns/common.topic.topic_equivalent_webpage>  <http://openlibrary.org/authors/OL514554A>  .
<http://rdf.freebase.com/ns/m.010q36>   <http://rdf.freebase.com/ns/book.author.openlibrary_id> "OL514554A" .
<http://rdf.freebase.com/ns/m.010q36>   <http://rdf.freebase.com/ns/type.object.key>    "/authority/openlibrary/author/OL514554A"   .
<http://rdf.freebase.com/ns/m.010q36>   <http://rdf.freebase.com/key/authority.openlibrary.author>  "OL514554A" .

缩写以便更好地展示:

<s> <fb:/ns/common.topic.topic_equivalent_webpage>  <http://openlibrary.org/authors/OL514554A>  .
<s> <fb:/ns/book.author.openlibrary_id> "OL514554A" .
<s> <fb:/ns/type.object.key>    "/authority/openlibrary/author/OL514554A"   .
<s> <fb:/key/authority.openlibrary.author>  "OL514554A" .

单个OpenLibrary标识符以四种不同的形式呈现,这有点过分,重要的是/authority名称空间中的任何内容都可以作为强标识符。