urllib2 geturl()不适用于某些网址重定向

时间:2013-01-14 13:54:59

标签: python python-2.7 urllib2

我正在学习python并试图让urllib2 geturl()工作。到目前为止,我有以下骨架,看起来像:

import urllib2
gh=urllib2.urlopen(http://somewebsite.com/).geturl()
print gh

似乎工作正常。但是,当我尝试使用给定here的网址时,它无法获得“最终网址”(但可以在浏览器上运行)。

我很感激任何指导来解决这个问题。

1 个答案:

答案 0 :(得分:8)

发生这种情况,因为您使用javascript重定向,而urllib2无法处理javascript。如果处理javascript重定向很重要,请使用selenium