在维基百科中访问传记的标题

时间:2012-04-03 04:09:52

标签: mediawiki wikipedia

我已下载Wikipedia最新转储并将其解析为MySQL数据库。现在我有数据库表只包含标题和内容。我的要求是从这个表中提取所有的传记内容。所以我想要一个包含所有传记标题的转储文件。 提前致谢

1 个答案:

答案 0 :(得分:0)

如果您想要获取某个类别及其所有子类别中的所有文章,您需要使用the categorylinks table并递归遍历以获取子类别中的文章。

从你的问题中不清楚你到底想要什么。如果您想要文章关于传记,请查看Category:Biography。如果您想要 传记的文章,请查看Category:People的子类别。