如何获得所有维基百科的文章标题?

时间:2016-11-27 01:49:45

标签: title wikipedia article

如何在一个地方获取所有维基百科文章标题,而无需额外的字符和pageid。只是文章的标题。像这样:

image

当我下载维基百科转储时,我得到this

也许我知道一个可能让我看到所有页面的动作,但我想让所有页面合在一起。

1 个答案:

答案 0 :(得分:3)

您可以在https://dumps.wikimedia.org

上找到它

英语维基百科作为数据库转储的最新主命名空间中的页面标题列表为here(69 MB)。

如果您希望通过API来使用querylist=allpages,但一次只能为您提供最多500(机器人5k),因此您必须制作超过10,000个API调用英语维基百科。

示例: https://en.wikipedia.org/w/api.php?action=query&format=xml&list=allpages&aplimit=max