我尝试从网络上获取数据,但页面使用302重定向 我如何使用python来获取真实的网址?
答案 0 :(得分:4)
查看chapter 11.7. Handling redirects系列中的Dive Into Python。它以非常详细的方式解释了您的整个问题,示例代码和所有问题。
答案 1 :(得分:3)
你目前在使用什么? urllib
和urllib2
都应自动处理:
page = urllib.urlopen('http://mrozekma.com/302test.php')
>>> print page.geturl() # This will show the redirected-to URL
http://mrozekma.com/302test.php?success
>>> print page.readlines()
['Success']
答案 2 :(得分:0)
如果您使用的是http.client.HTTPConnection(3.x)或httplib.HTTPConnection(2.x),只需获取位置标题:
response.getheader('Location')
我知道这至少在craigslist.org
上有效