迭代维基百科

时间:2016-02-26 12:26:39

标签: wikipedia

我想研究一下维基百科上用来描述人们的语言。我的脚本准备就绪并通过测试,但我有一个问题:我不知道如何请求每个维基百科的传记页面。

有谁知道如何获取维基百科网址列表和/或获得某种" next"网址是什么?只要看到传记网址就可以了。

1 个答案:

答案 0 :(得分:1)

理论上,所有传记都应该在Category:People by gender

的子类别中

然后你可以使用PetScan(使用CSV输出或类似)或MediaWiki API使用categorymembers功能来检索文章,但要注意:这些是很多的!