以此为例: http://en.wikipedia.org/wiki/United_States_Bill_of_Rights
在“修正案”部分,我希望得到每个项目符号所说的内容,并将它们显示在Android应用程序的一个很好的列表中。我知道有一个维基媒体api,但我完全不知道如何使用它,根据我的理解,你可以在一个部分下得到文本,但我不确定你是否可以分别得到每个子弹点。
最好的方法是什么?或者不是这样,我是否应该花时间将300多页的文本复制到文本文件中,并在应用程序中阅读?
答案 0 :(得分:2)
此链接使用mediawiki API从您的问题(based on this wiki article)查询页面:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=United_States_Bill_of_Rights
如您所见,它返回一个xml文档,页面文本位于<rev>
标记下。它是mediawiki文本标记语言中的普通编辑器文本。
因此,要从此文本中提取信息,您应该使用解析。 Here is a list of alternative parsers,有些是用Java编写的。
答案 1 :(得分:1)
我相信你会想到这个: