我使用MediaWiki API以JSON格式获取维基百科页面的内容。
http://en.wikipedia.org/w/api.php?format=json&action=query&titles=New_York&prop=extracts
我希望将每个部分分开,而不是将页面的全部内容作为一个值。我知道你可以得到这样的每个部分,但我希望它也包括每个部分的内容。
http://en.wikipedia.org/w/api.php?format=json&action=parse&prop=sections&page=New_York
这可能与API有关吗?
答案 0 :(得分:1)
如果您知道所需部分的编号,则可以使用action=parse
参数通过section
获取内容。例如。 " 19世纪" New_York文章的部分将是:
https://en.wikipedia.org/w/api.php?action=parse&page=New_York&format=json&prop=wikitext§ion=4
要获取部分编号,您可以使用
http://en.wikipedia.org/w/api.php?format=json&action=parse&prop=sections&page=New_York
然后找到与您的部分标题(index
)对应的line
。在这种情况下"line":"19th century","index":"4"
。