http://live.dbpedia.org/liveupdates/
处的变更集似乎是按时间排序的,但是他们对重播的解释并不完全清楚。
关于配对的添加和删除文件,当编辑现有值(例如<http://dbpedia.org/ontology/abstract>
)时,这会导致仅添加&#39;使用新值输入,或者删除&#39;旧的,然后添加&#39;新的?
下载每日摘要tar后 - 例如http://live.dbpedia.org/liveupdates/2013/07/2013-07-07.tar.gz
- 初始解包后会提供大量顶级添加/删除文件对(确切地说是1232)。但是,还有24小时的额外tarfiles(2013-07-07-[00-23].tar.gz
),每个tarfiles都有自己添加/删除的文件对。顶级文件是否排在&#39;之后,&#39;&#39;之后?或者冗余 - 每小时文件?
答案 0 :(得分:1)
DBpedia Live 生成两组添加和删除的文件,分别包含添加和删除的三元组。 在更改文章时,新旧三元组以nt格式写入并分别保存到添加/删除的文件中,然后将这些文件压缩并存储在服务器上。 DBpedia sync-tool会不断下载这些文件,对其进行解压缩并使用它们来更新官方DBpedia Live endpoint的本地镜像。
因此,首先将旧的三元组从本地镜像中移除,然后插入新的三元组。