我正在尝试从维基百科文章中获取修订历史记录,以便我可以获取参与该文章时发生的最新更改或事件。
http://en.wikipedia.org/wiki/Wikipedia:Syndication提到了RSS RSS可以通过此RSS URL http://en.wikipedia.org/w/index.php?title=ARTICLENAME&action=history&feed=rss获得的文章。
但是上面的URL没有控制修订历史日期的参数。我想知道是否有更好的方法通过计算机程序获取文章修订历史记录或以任何方式调整给定的RSS URL。
答案 0 :(得分:4)
您可以使用the MediaWiki API。具体而言,the revisions
module。
答案 1 :(得分:0)
您也可以尝试pywikipediabot,尝试快照:
import wikipedia
site= wikipedia.Site("pt", "wikipedia")
wpage = wikipedia.Page(site, u"Portugal")
for i in wpage.getVersionHistory():
print i