如何根据时间和编辑解释DBPedia实时更改集?

时间:2013-07-10 21:00:28

标签: dbpedia

http://live.dbpedia.org/liveupdates/处的变更集似乎是按时间排序的,但是他们对重播的解释并不完全清楚。

关于配对的添加和删除文件,当编辑现有值(例如<http://dbpedia.org/ontology/abstract>)时,这会导致仅添加&#39;使用新值输入,或者删除&#39;旧的,然后添加&#39;新的?

下载每日摘要tar后 - 例如http://live.dbpedia.org/liveupdates/2013/07/2013-07-07.tar.gz - 初始解包后会提供大量顶级添加/删除文件对(确切地说是1232)。但是,还有24小时的额外tarfiles(2013-07-07-[00-23].tar.gz),每个tarfiles都有自己添加/删除的文件对。顶级文件是否排在&#39;之后,&#39;&#39;之后?或者冗余 - 每小时文件?

1 个答案:

答案 0 :(得分:1)

DBpedia Live 生成两组添加和删除的文件,分别包含添加和删除的三元组。 在更改文章时,新旧三元组以nt格式写入并分别保存到添加/删除的文件中,然后将这些文件压缩并存储在服务器上。 DBpedia sync-tool会不断下载这些文件,对其进行解压缩并使用它们来更新官方DBpedia Live endpoint的本地镜像。

因此,首先将旧的三元组从本地镜像中移除,然后插入新的三元组。