Python获取数据403

时间:2010-12-28 12:38:02

标签: python urllib2 fetch http-status-code-403 httplib2

我正在尝试使用urllib2从网页中获取数据。该页面在浏览器上可见,但通过脚本我不断收到HTTPError:HTTP错误403:禁止

我还尝试通过更改用户代理字符串来模仿浏览器请求,但没有成功。

有关于此的任何想法吗?

3 个答案:

答案 0 :(得分:2)

我尝试使用篡改数据和firefox只发送用户代理,我得到403。 尝试添加其他标题:

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 115
Connection: keep-alive

我试过了,这应该可行。

答案 1 :(得分:1)

该网站正在检查您的User-Agent,只需将其设置为Internet Explorer

request.add_header('User-Agent', 'Internet Explorer')

我确认这适用于wget,除非您将用户代理设置为Internet Explorer,否则您将获得403。

答案 2 :(得分:0)

:)我试图从NSE获得报价!像pythonFoo说你需要额外的标题。仅限Hower就足够了。 用户代理可以说python(保持真实!)