标签: java parsing jsoup wikipedia
我正在尝试阅读并打印出英语维基百科中列出的所有标题。它有一个特殊的页面,“所有页面”,按字母顺序显示所有页面。
我遇到的问题:
一开始!但我不知道它在哪里结束..所有页面似乎都继续通过Æ这样的字符继续,我不想要那些
标题在很多页面上,所以我需要在阅读完一页标题后重新加载“下一页”
我没有使用过jsoup的经验,所以我不知道我在做什么
答案 0 :(得分:0)
https://www.mediawiki.org/wiki/API:Allpages - 返回给定命名空间中的页面列表,按页面标题排序。