如何使用API​​从Wikipedia获取表数据

时间:2020-04-05 14:22:54

标签: api wikipedia

如何构造查询以从https://en.wikipedia.org/wiki/Michael_Bisping综合武术记录部分的(第一)表中获取数据?理想情况下,我希望将表数据获取为json,但HTML也可以使用。

我尝试使用该查询来获取页面的各个部分:https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping

结果告诉我该表在索引为12的部分中。我不知道接下来应该运行什么查询。

2 个答案:

答案 0 :(得分:1)

使用API Sandbox来生成网址!

action设置为parse

PageMichael Bisping

Section12(混合武术记录)

最终网址:

https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text&section=12&callback=


我已经将prop=extractsaction=query一起使用来获取解析结果:

https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts

但是,section=12无法实现此请求(?),也许还有另一种解析结果的方法

答案 1 :(得分:0)

我设法通过以下查询获得了整个部分:https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping&section=12

我通过查询特定部分的索引(在本例中为12)来定位该部分。