urlopen(url)403禁止错误

时间:2012-11-21 17:37:21

标签: http-status-code-403

我正在使用python打开包含以下代码的URL,有时我会收到此错误:

来自urllib import urlopen url =“http://www.gutenberg.org/files/2554/2554.txt” raw = urlopen(url).read()

错误:'\ n \ n403禁止\ n \ n

禁止

\ n

您无权访问/files/2554/2554.txt \非此服务器。

\ n
\ nApache Server www.gutenberg.org端口80 \ n \ n'

这是什么?

谢谢

1 个答案:

答案 0 :(得分:2)

这是阻止Python访问的网页,因为它使用标题'User-Agent'发出请求。

要解决此问题,请下载'urllib2'模块并使用以下代码:

req = urllib2.Request(url, headers ={'User-Agent':'Chrome'})
raw = urllib2.urlopen(req).read()

您知道使用标题“Chrome”访问该网站,并且不应再禁止该网站(我自己尝试过并且有效)。

希望这有帮助。