Wikipedia API,提取包含链接文本的文本

时间:2017-06-22 01:55:14

标签: json wikipedia-api

我正在尝试从List of popular music genres维基百科文章中提取文本,以便我可以查看子类型的类型。

我找到了一些描述如何提取文本的Stack Overflow链接,但是也很难从页面获取链接文本。

例如:

http://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&explaintext&titles=List%20of%20popular%20music%20genres

会向我提供页面中的文字,但不包括每种类型下列出的任何子类型。

1 个答案:

答案 0 :(得分:0)

通过动作解析更好地使用MediaWiki API

https://en.wikipedia.org/w/api.php?format=json&action=parse&prop=wikitext&page=List of popular music genres

此外,还包括&section=6以获取仅适用于此部分的内容:

https://en.wikipedia.org/w/api.php?format=json&action=parse&prop=wikitext&page=List of popular music genres&section=6