将最近更改中的文章导出到xml转储

时间:2013-08-31 05:01:31

标签: xml mediawiki

我正在寻找转储(xml格式,包括模板)的解决方案每篇文章在过去一小时内的编辑方式。

我开始使用imacro for firefox。获取文章列表现在很好。目前我有文章名称的问题,其中包括空格或德国变音符号。

e.g.Eidgen%C3%B6ssische_Konstruktionswerkst%C3%A4tte_K%2BW_C-35

如何将i转换为“真正的”文章名称?

1 个答案:

答案 0 :(得分:1)

您看到的标题已编码,可在网址中使用。您的编程语言应提供解码这些语言的标准方法,例如: PHP中的“urldecode”,JavaScript中的“decodeURIComponent”,Python中的“urllib2.quote”等。

但如果您通过MediaWiki API获取已更改页面的标题,则根本不需要这样做。请参阅维基百科的此查询,例如:https://de.wikipedia.org/w/api.php?action=query&list=recentchanges&format=xml