增量更新文档不够清晰

时间:2016-01-26 09:36:59

标签: wikimedia wikidata wikidata-api

我有一个数据库,我需要跟上维基数据变化的变化,当我在寻找方法时,我发现了这三个:

  • RSS
  • API致电
  • Socket.IO

我想知道是否有其他方法,哪一个是最好的或维基百科推荐

1 个答案:

答案 0 :(得分:1)

答案取决于您需要保持数据库的最新状态。

尽可能更新

如果您需要尽可能使数据库与Wikidata保持同步,那么您可能希望使用已找到的解决方案的组合。

Socket.IO将为您提供已更改内容的流,但不一定会为您提供所需的所有信息。 (注意:有一个IRC流可以让你做同样的事情)

根据流提供的数据,您可以调用维基数据API检索新数据。

当然这可能会导致大量API调用,因此请确保批量处理它们,并且如果连续发生大量更改,也不要立即检索更新。

每日或每周

除了上面列出的3个选项,您还拥有数据库转储! https://www.wikidata.org/wiki/Wikidata:Database_download

JSON&通常建议使用RDF转储。 JSON转储包含与存储时完全相同的数据。这些转储是每周进行的。

不保证XML转储与JSON转储具有相同的JSON格式,因为它们使用内部序列化格式。但是,提供了每日XML转储。