我想尝试从维基百科中获取网球运动员的描述而不会刮擦球员x上的DOM页面。这是不允许的,也很无聊。所以,我希望有人可以回复我唯一的问题。
我可以准确地使用维基百科API做什么?我可以轻松获得有关网球运动员的信息吗?或者这个API不起作用。如果没有,我需要有人告诉我这个API的目的是什么,因为我不懂文档。
答案 0 :(得分:2)
你可以获取这样的文章:
http://en.wikipedia.org/w/index.php?title=Stackoverflow&printable=yes
或使用API:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Stack%20Overflow&rvprop=content
这将为您提供原始文章代码。要获取html版本,请使用action=parse
:
http://en.wikipedia.org/w/api.php?action=parse&format=json&page=Stack_Overflow
另请查看文档:{{3}}
答案 1 :(得分:2)
看看Wikipedia API Sandbox - 你可以玩,并尝试获取你需要的信息。
要从页面获取信息,您可以使用解析操作。
试图获取丹麦网球运动员Caroline Wozniacki的信息,我使用解析动作以及 json 格式。
在标有页面的字段中,我粘贴了Caroline_Wozniacki
,然后按了提交请求。
这给了我这个网址:http://en.wikipedia.org/w/api.php?action=parse&format=json&page=Caroline_Wozniacki
这包含带有链接,引用和所有JSON格式的页面。