我尝试通过api获取维基百科文章的所有单独部分。
我已经知道了:
如何检索完整文本:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvlimit=1&titles=house&rvprop=content
如何检索文本的特定部分:
如何使用一个请求单独检索所有部分? (例如JSON数组)
答案 0 :(得分:6)
你所要求的是解析,因为它需要解释wikitext源以按部分拆分页面等。所以解决方案在https://www.mediawiki.org/wiki/API:Parsing_wikitext
中给出1)获取部分列表:https://www.mediawiki.org/w/api.php?action=parse&page=API:Parsing_wikitext&prop=sections
2)询问该部分的解析wiki文本:https://www.mediawiki.org/w/api.php?action=parse&page=API:Parsing_wikitext§ion=1&prop=text
答案 1 :(得分:2)
我知道这个问题是四年前提出的,因此以下内容可能不可用:
您可以使用此处描述的REST API:https://www.mediawiki.org/wiki/REST_API
此处描述/记录了REST端点:https://en.wikipedia.org/api/rest_v1/#/
mobile-sections
端点(旨在使用移动设备的信息)使您可以很好地了解标题,这听起来像您要的内容。
或者,metadata
端点返回一个toc(目录)部分,其中包含相同的标题细分。
下面是一个示例URL,它为“埃及金字塔”页面获取了移动部分: https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Egyptian_pyramids
优点是响应为JSON格式(这就是您要的内容)。