我想获取维基百科上所有历史事件的文章?最好的方法是什么? Wiki API?数据库转储?我已经检查了DBPedia,到目前为止它似乎非常有限(尽管仍然令人印象深刻)。
答案 0 :(得分:1)
有关历史事件的所有文章的列表,请查看the Events category,尤其是its subcategory Events by time。要获取类别及其所有子类别中的所有文章,您可以使用API或SQL转储(至少需要表categorylinks
和page
;如果您使用.Net,{ {3}}可以帮助你。)
要实际获取许多文章的文本,您一定要使用XML转储,可能是pages-articles
。