我无法通过Wiki API从子类别中获取纯文本。
我正在使用
https://en.wikipedia.org/w/api.php?action=query&titles=Submarine§ion=4&prop=extracts&explaintext&exsectionformat=plain&redirects
以便从Wiki获取站点摘要。现在,我只希望获得第四部分的内容。我尝试通过简单地添加:
§ion=4
无论我尝试什么,这似乎都被拒绝了。 虽然我可以使用以下内容来获取部分内容:
https://en.wikipedia.org/w/api.php?action=parse&page=Submarine&prop=wikitext&explaintext&exsectionformat=plain&&format=json&origin=*&action=parse§ion=4
但是,如果没有Wiki减价,我将无法获得我的文本。
最有可能的解决方案是这两种方法的结合,但是我实在无法解决……
These docs here可能会有帮助。
我们非常感谢您的帮助!
答案 0 :(得分:0)
我找到了解决方案!
在为@Tgr给我的答案而苦苦挣扎之后,我偶然发现了一个令人赞叹的JS库: wtf_wikipedia 。 我希望Wiki决定给这个人一个勋章! 例如,获取第8类的文本就这么简单:
doc.sections(8).text()