好的,我只想使用python访问此URL:http://www.gocomics.com/wizardofid/2013/01/22
但是,每当我调用urllib2.urlopen('http://www.gocomics.com/wizardofid/2013/01/22')。read()时,它会给我403错误。使用urllib,我所能做的就是读取错误页面,但是urllib2会引发错误。当我在Chrome中查看该页面时,它不会给我任何问题。为什么会这样,我该如何解决?谢谢!
答案 0 :(得分:3)
此特定网站需要“类似浏览器”的User-Agent
标头,否则会拒绝访问。
尝试添加标题,例如(例如):
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
urllib2.install_opener(opener)
print urllib2.urlopen('http://gocomics.com/wizardofid/2013/01/22').read()