有没有办法获得维基百科网址的最终目的地?

时间:2017-06-30 00:01:46

标签: python wikipedia wikipedia-api

我目前正在尝试使用其科学名称获取任何可用语言的鸟类描述页面。例如,使用科学名称“Ibycter americanus”作为“https://en.wikipedia.org/wiki/”的端点,浏览器会将我重定向到the english wikipedia page。如果我使用子域“fr”,用法语获取它,我被重定向to the french page

这一切在浏览器中运行得很好,但是我无法在python代码中获得最终的URL:

req = urllib2.Request("https://en.wikipedia.org/wiki/" + "Ibycter americanus")
res = urllib2.urlopen(req)
finalurl = res.geturl()
print(finalurl)

finalurl始终为“https://en.wikipedia.org/wiki/Ibycter_americanus”,而不是像浏览器中显示的“https://en.wikipedia.org/wiki/Red-throated_caracara”。有什么想法吗?

1 个答案:

答案 0 :(得分:1)

最好使用API​​来做这样的事情。例如。 action=query&titles=Ibycter+americanus&redirects=1