标签: wikipedia wikipedia-api
我想从维基百科dump file中提取给定类别的实际内容,但我无法确定哪个转储文件包含实际的页面内容。
答案 0 :(得分:1)
以enwiki-latest-pages-articles<number>.xml...开头的文件包含页面。有关转储文件的信息,请参阅https://en.wikipedia.org/wiki/Wikipedia:Database_download。
enwiki-latest-pages-articles<number>.xml...
答案 1 :(得分:0)
链接到 Wikipedia 转储文件 :