我正在使用以下代码获取重定向网址。
req = urllib2.Request(url_str, headers=hdrs)
real_url = urllib2.urlopen(req).geturl()
例如,如果我设置url_str = 'http://wearfigs.com'
并运行代码,那么我最终得到real_url = 'http://www.figsscrubs.com'
,这就是我想要的,因为在浏览器中,wearfigs.com重定向到figsscrubs.com。
但是,当我尝试将url_str设置为http://www.greenforestry.us的相同过程时,即使浏览器重定向到http://www.greenforestry.us/GreenForestry.us/Welcome.html,它给我的real_url也完全相同。相同的netloc,不同的路径。我想在每种情况下获得最终的重定向URL,包括当netloc相同且路径不同时,如上例所示,但是geturl()没有做到这一点。有办法吗?