如何在给定日期之前检索维基百科文章的历史版本?

时间:2017-01-18 11:56:29

标签: wikipedia wikipedia-api mediawiki-api

有没有办法使用MediaWiki API或任何其他工具使用大致日期自动检索以前版本的维基百科文章(不知道' oldid'值)?

例如,如何使用" 2016年12月" " 2016年12月20日&##从2016年12月20日起检索history version of Stack Overflow文章&# 34; 或这一天的日期作为参数?

2 个答案:

答案 0 :(得分:4)

您可以使用MediaWiki API操作查询和属性修订来执行此操作。要获得2016年12月20日00:00:00之后Stack Overflow的第一次修订,您可以使用:

https://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Stack%20Overflow&rvlimit=1&rvprop=content&rvdir=newer&rvstart=2016-12-20T00:00:00Z

其中 rvlimit 是要返回的历史记录版本的数量, rvdir = newer 表示按从最旧到的顺序列出的结果(如果rvlimit> 1)最新, rvstart 是获取页面历史版本的时间。

答案 1 :(得分:0)

Special:Export页面上的卷曲请求也可能有所帮助,方法是将偏移参数设置为' 2016-12-20T00:00:00Z'

curl -d "" 'https://en.wikipedia.org/w/index.php?title=Special:Export&pages=Stack_Overflow&offset=2016-12-20T00:00:00Z&limit=1&action=submit'