如何构造查询以从https://en.wikipedia.org/wiki/Michael_Bisping的综合武术记录部分的(第一)表中获取数据?理想情况下,我希望将表数据获取为json,但HTML也可以使用。
我尝试使用该查询来获取页面的各个部分:https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping
结果告诉我该表在索引为12的部分中。我不知道接下来应该运行什么查询。
答案 0 :(得分:1)
使用API Sandbox来生成网址!
将action
设置为parse
。
Page
至Michael Bisping
Section
至12
(混合武术记录)
最终网址:
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text§ion=12&callback=
prop=extracts
与action=query
一起使用来获取解析结果:
https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts
但是,section=12
无法实现此请求(?),也许还有另一种解析结果的方法
答案 1 :(得分:0)
我设法通过以下查询获得了整个部分:https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping§ion=12
我通过查询特定部分的索引(在本例中为12)来定位该部分。