尝试从Python访问网页时的状态代码403

时间:2015-06-09 07:36:11

标签: php python ajax

我已经尝试过使用JSON,但无法真正阅读此页面。

这是我的python代码。我已经在其他网站上尝试了它并且它有效,但在这个网站上它返回403。

import urllib2

req = urllib2.Request('http://www.taringa.net/envivo/ajax.php')
response = urllib2.urlopen(req)
the_page = response.read()

print the_page

2 个答案:

答案 0 :(得分:1)

更好地使用requests。我尝试了你的脚本并获得了403的状态。这意味着无论出于什么原因,我都不知道对它的访问是否已关闭。

答案 1 :(得分:0)

您必须添加' User-Agent'标题,以使这项工作。

Urllib代码:

req = urllib2.Request('http://www.taringa.net/envivo/ajax.php')
req.add_header('User-Agent', 'Mozilla')
resp = urllib2.urlopen(req)
print resp.code  # Gives 200.
print resp.read()  # Gives the HTML of the page.

我建议您使用requests主要是因为它使这种东西非常容易。

请求代码:

h = {'User-Agent':'Mozilla'}
requests.get('http://www.taringa.net/envivo/ajax.php', headers=h)