如何下载维基百科图像转储

时间:2018-04-09 14:40:25

标签: wikipedia wiki wikipedia-api wikimedia wikimedia-dumps

我正在尝试制作维基百科的离线版本。但问题是我无法下载维基百科的图片转储。它们提供的只是带有元图像信息的SQL,在任何地方都没有actula图像。

Dump Link

另外,我使用维基媒体在本地服务器上运行维基百科。任何帮助如何下载图像或有其他方式下载本地的图像/内容。

3 个答案:

答案 0 :(得分:2)

您可能希望查看提供Kiwix缩略图经验的complete offline Wikipedia。 (~75 GiB)

没有任何tarball的原因是因为它巨大。英语维基百科is 162 GiB的“合理使用”媒体(低分辨率版权图像,如海报,专辑封面等)。我们在Wikimedia Commons上有很多媒体,153 TiB,大部分未被使用。

仅限于英语维基百科所需的内容,您需要从4,525,268个非多媒体文件下载 5.1 TiB

答案 1 :(得分:1)

没有这样的事情。 2012年的旧转储可用on archive.org

答案 2 :(得分:1)

您可以下载离线阅读器来访问Wikipedia。 我使用此处http://xowa.org/home/wiki/Help/Download_XOWA.html的Xowa 如果下载了该文件,请打开导入包,它将指向可用转储列表。 我用的是simplewiki dump,大约400mb,没有图片,只有文字。 如果要使用全部功能,则选择较大的转储

这些读者很多。 您可以访问此页面以获取更多信息 https://en.m.wikipedia.org/wiki/Wikipedia:Database_download