如何在Python中获取最终的重定向URL,包括路径? (urllib2.urlopen()。geturl()不是这样做的)

时间:2013-06-20 21:41:59

标签: python redirect urllib2 geturl

我正在使用以下代码获取重定向网址。

req = urllib2.Request(url_str, headers=hdrs)
real_url = urllib2.urlopen(req).geturl()

例如,如果我设置url_str = 'http://wearfigs.com'并运行代码,那么我最终得到real_url = 'http://www.figsscrubs.com',这就是我想要的,因为在浏览器中,wearfigs.com重定向到figsscrubs.com。

但是,当我尝试将url_str设置为http://www.greenforestry.us的相同过程时,即使浏览器重定向到http://www.greenforestry.us/GreenForestry.us/Welcome.html,它给我的real_url也完全相同。相同的netloc,不同的路径。我想在每种情况下获得最终的重定向URL,包括当netloc相同且路径不同时,如上例所示,但是geturl()没有做到这一点。有办法吗?

0 个答案:

没有答案