我正在尝试使用MediaWiki API获取带有内部链接的文本。这就是我现在所拥有的:
https://en.wikipedia.org/w/api.php?format=json&prop=links&action=query&prop=extracts&exlimit=max&explaintext&titles=Yahoo&redirects=
如何使用内联链接获取此文本?
答案 0 :(得分:0)
要使用您的查询获取多个属性,您必须通过管道将它们分开:"|"
。因此,您的&prop=links&prop=extracts
(extracts覆盖links)必须为&prop=links|extracts
,或者:
https://en.wikipedia.org/w/api.php?action=query&titles=Yahoo!&prop=links|extracts&pllimit=100&explaintext
但这就是你将如何分别获取内容和链接。如果您需要使用明确的 wiki标记格式获取内部链接的内容,则可以使用与query属性相同的操作revisions:
https://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Yahoo!&rvprop=content
要以 HTML标记格式获取相同的内容,您可以将&rvparse
添加到上一个请求中:
https://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Yahoo!&rvprop=content&rvparse
或者您也可以使用操作parse:
https://en.wikipedia.org/w/api.php?action=parse&page=Yahoo!&prop=text