使用JSOUP阅读维基百科的标题"所有页面"特别页面

时间:2014-11-20 20:41:15

标签: java parsing jsoup wikipedia

我正在尝试阅读并打印出英语维基百科中列出的所有标题。它有一个特殊的页面,“所有页面”,按字母顺序显示所有页面。

我遇到的问题:

  • 一开始!但我不知道它在哪里结束..所有页面似乎都继续通过Æ这样的字符继续,我不想要那些

  • 标题在很多页面上,所以我需要在阅读完一页标题后重新加载“下一页”

  • 我没有使用过jsoup的经验,所以我不知道我在做什么

1 个答案:

答案 0 :(得分:0)

https://www.mediawiki.org/wiki/API:Allpages - 返回给定命名空间中的页面列表,按页面标题排序。