我专门针对维基百科(enwiki)的英文版本发言。我通过下载sql转储(categorylinks,page,page_prop)尝试使用其他较轻版本的维基百科,但是使用英文版本并不容易。我现在正在将sql文件中的数据写入数据库,但我想要一些其他更简单的方法,因为这将花费很多时间。如果我真的成功写入数据,查询可能会永远。那么,我如何从英语维基百科中编制文章及其类别列表呢?
答案 0 :(得分:0)
嗯,这个问题没有简单的答案。使用传统计算机下载和使用转储并不是很平易近人。值得庆幸的是,我使用了一个名为Quarry的服务,让您查询维基百科数据库。但是有一些限制,所以为了获得上面的列表,我不得不使用limit clause
将查询切成更小的部分并给出相同的查询+50次。对于想要此数据的任何人,可以访问我的quarry profile并从Article - Categories
查询中获取数据。