如何通过内部链接获取维基百科页面内容?

时间:2016-11-15 14:47:58

标签: javascript json api mediawiki wikipedia-api

我正在尝试使用MediaWiki API获取带有内部链接的文本。这就是我现在所拥有的:

https://en.wikipedia.org/w/api.php?format=json&prop=links&action=query&prop=extracts&exlimit=max&explaintext&titles=Yahoo&redirects=

如何使用内联链接获取此文本?

1 个答案:

答案 0 :(得分:0)

要使用您的查询获取多个属性,您必须通过管道将它们分开:"|"。因此,您的&prop=links&prop=extractsextracts覆盖links)必须为&prop=links|extracts,或者:

https://en.wikipedia.org/w/api.php?action=query&titles=Yahoo!&prop=links|extracts&pllimit=100&explaintext

但这就是你将如何分别获取内容和链接。如果您需要使用明确的 wiki标记格式获取内部链接的内容,则可以使用与query属性相同的操作revisions

https://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Yahoo!&rvprop=content

要以 HTML标记格式获取相同的内容,您可以将&rvparse添加到上一个请求中:

https://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Yahoo!&rvprop=content&rvparse

或者您也可以使用操作parse

https://en.wikipedia.org/w/api.php?action=parse&page=Yahoo!&prop=text