我已经尝试过使用JSON,但无法真正阅读此页面。
这是我的python代码。我已经在其他网站上尝试了它并且它有效,但在这个网站上它返回403。
import urllib2
req = urllib2.Request('http://www.taringa.net/envivo/ajax.php')
response = urllib2.urlopen(req)
the_page = response.read()
print the_page
答案 0 :(得分:1)
更好地使用requests。我尝试了你的脚本并获得了403的状态。这意味着无论出于什么原因,我都不知道对它的访问是否已关闭。
答案 1 :(得分:0)
您必须添加' User-Agent'标题,以使这项工作。
Urllib代码:
req = urllib2.Request('http://www.taringa.net/envivo/ajax.php')
req.add_header('User-Agent', 'Mozilla')
resp = urllib2.urlopen(req)
print resp.code # Gives 200.
print resp.read() # Gives the HTML of the page.
我建议您使用requests主要是因为它使这种东西非常容易。
请求代码:
h = {'User-Agent':'Mozilla'}
requests.get('http://www.taringa.net/envivo/ajax.php', headers=h)