如何从Wiki API子类别中获取纯文本

时间:2019-01-19 23:35:31

标签: javascript json api wikipedia

我无法通过Wiki API从子类别中获取纯文本。

我正在使用

https://en.wikipedia.org/w/api.php?action=query&titles=Submarine&section=4&prop=extracts&explaintext&exsectionformat=plain&redirects

以便从Wiki获取站点摘要。现在,我只希望获得第四部分的内容。我尝试通过简单地添加:

&section=4

无论我尝试什么,这似乎都被拒绝了。 虽然我可以使用以下内容来获取部分内容:

https://en.wikipedia.org/w/api.php?action=parse&page=Submarine&prop=wikitext&explaintext&exsectionformat=plain&&format=json&origin=*&action=parse&section=4

但是,如果没有Wiki减价,我将无法获得我的文本。

最有可能的解决方案是这两种方法的结合,但是我实在无法解决……

These docs here可能会有帮助。

我们非常感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

我找到了解决方案!

在为@Tgr给我的答案而苦苦挣扎之后,我偶然发现了一个令人赞叹的JS库: wtf_wikipedia 。 我希望Wiki决定给这个人一个勋章! 例如,获取第8类的文本就这么简单:

doc.sections(8).text()