我开始研究Freebase。我对网页有些困惑:
在以下link中,他们将等效网页描述为外部网页的链接。这些外页是维基百科页面和Freebase页面,IMDb页面等。
“外页”是什么意思?我不明白,外面到底究竟是什么?它在实体之外吗?
Barack Obama的外部网页是:
- http://www.nytimes.com/top/reference/timestopics/people/o/barack_obama
- http://www.nndb.com/people/208/000055043/
- http://bioguide.congress.gov/scripts/biodisplay.pl?index=O000167
- http://openlibrary.org/authors/OL529531A
- http://www.myspace.com/barackobama
- http://www.tvrage.com/person/id-82898
- http://id.loc.gov/authorities/names/n94112934.html
- http://viaf.org/viaf/52010985/
- http://de.wikipedia.org/wiki/index.html?curid=297666
- http://fr.wikipedia.org/wiki/index.html?curid=167398
这些页面对“巴拉克奥巴马”来说是独一无二的吗?我们不能将它们视为唯一标识符。
这些实体是“巴拉克奥巴马”出现的页面吗?
答案 0 :(得分:1)
这个答案可能含糊不清,因为我没有freebase的副本。根据您提供的链接,虽然它们似乎是以某种方式用作Topic Equivalent Webpage属性的值的链接/ uris。 topic_equivalent_webpage
有一个描述:
描述主题的焦点奇特的网页。 (即仅与主题有关的页面。)
所以这就是它们 - 它们只有一个焦点,描述主题(在这种情况下是巴拉克奥巴马),并且可以来自网络上的任何地方。我不确定freebase中的误报,所以我会谨慎地将它们视为该主题的唯一标识符。我觉得这些更像是语义Web术语中的rdfs:seeAlso
值,而不是等效/相同的实体。您可以在KB中运行一些检查:
您可以检查这些页面与Barack Obama实体之间是否存在owl:sameAs
链接。在这种情况下,你可以认为它们在绝对意义上是等价的(例如关于巴拉克奥巴马所宣称的任何东西都可以传播并持有“等价”实体/页面)。同样,在您的KB / freebase的上下文中。
假设这些是topic_equivalent_webpage
属性的值,您可以检查该属性是否与rdfs:subPropertyOf
具有owl:equivalentProperty
或owl:sameAs
关系。在这种情况下,您的知识库认为它们是等效的。
答案 1 :(得分:1)
绝大多数可被视为强标识符。您可以通过查看“密钥”选项卡https://www.freebase.com/m/02mjmr?keys=
来确定哪些内容这是Freebase最大的优势之一,这些丰富的协调实体标识符适用于各种不同的外部信息源(维基百科,IMDB,MusicBrainz,国会图书馆等)。
每个密钥都与一个名称空间相关联,每个名称空间都是唯一的,每个名称空间都有一个关联的URI模板,用于从密钥构造URI。例如,国会Bioguide URL与美国国会图书馆控制的名称空间相关联,并填充了用于识别立法者的THOMAS ID。
Freebase用户可以(或者可能)添加其他完全形成的URL,但很少发生。但是,如果您使用密钥,则可以保证只获得强标识符,而不是随机URL。
编辑:这是他们在批量Freebase RDF转储中的样子:
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/common.topic.topic_equivalent_webpage> <http://openlibrary.org/authors/OL514554A> .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/book.author.openlibrary_id> "OL514554A" .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/ns/type.object.key> "/authority/openlibrary/author/OL514554A" .
<http://rdf.freebase.com/ns/m.010q36> <http://rdf.freebase.com/key/authority.openlibrary.author> "OL514554A" .
缩写以便更好地展示:
<s> <fb:/ns/common.topic.topic_equivalent_webpage> <http://openlibrary.org/authors/OL514554A> .
<s> <fb:/ns/book.author.openlibrary_id> "OL514554A" .
<s> <fb:/ns/type.object.key> "/authority/openlibrary/author/OL514554A" .
<s> <fb:/key/authority.openlibrary.author> "OL514554A" .
单个OpenLibrary标识符以四种不同的形式呈现,这有点过分,重要的是/authority
名称空间中的任何内容都可以作为强标识符。