为什么python的urllib2.urlopen给我403错误?

时间:2013-01-23 01:51:34

标签: python urllib2 urllib http-status-code-403 python-2.5

  

可能重复:
  Python’s urllib2 doesn’t work on some sites

好的,我只想使用python访问此URL:http://www.gocomics.com/wizardofid/2013/01/22

但是,每当我调用urllib2.urlopen('http://www.gocomics.com/wizardofid/2013/01/22')。read()时,它会给我403错误。使用urllib,我所能做的就是读取错误页面,但是urllib2会引发错误。当我在Chrome中查看该页面时,它不会给我任何问题。为什么会这样,我该如何解决?谢谢!

1 个答案:

答案 0 :(得分:3)

此特定网站需要“类似浏览器”的User-Agent标头,否则会拒绝访问。

尝试添加标题,例如(例如):

import urllib2

opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
urllib2.install_opener(opener)
print urllib2.urlopen('http://gocomics.com/wizardofid/2013/01/22').read()