我已下载Wikipedia最新转储并将其解析为MySQL数据库。现在我有数据库表只包含标题和内容。我的要求是从这个表中提取所有的传记内容。所以我想要一个包含所有传记标题的转储文件。 提前致谢
答案 0 :(得分:0)
如果您想要获取某个类别及其所有子类别中的所有文章,您需要使用the categorylinks
table并递归遍历以获取子类别中的文章。
从你的问题中不清楚你到底想要什么。如果您想要文章关于传记,请查看Category:Biography。如果您想要 传记的文章,请查看Category:People的子类别。