我无法获得包含请求的html页面

时间:2016-09-06 09:58:40

标签: python timeout python-requests screen-scraping

我想获得一个html页面并阅读内容。我使用request(python),我的代码非常简单:

import requests    
url = "http://www.romatoday.it" 
r = requests.get(url)
print r.text

当我尝试执行此程序时,我得到了: 连接已中止。',错误(110,'连接超时') 如果我在浏览器中打开网址,那么一切正常。

如果我使用其他网址的请求,则一切正常

我认为是" http://www.romatoday.it"特殊性,但我不明白这是什么问题。你能帮我吗?

2 个答案:

答案 0 :(得分:0)

问题可能是这里的逗号

>> url = "http://www.romatoday,it" 

应该是一个点

>> url = "http://www.romatoday.it"

我试过了,它对我有用

答案 1 :(得分:-1)

嗯..你试过其他包裹,而不是'请求'吗? 代码打击与您的代码结果相同。

import urllib

url = "http://www.romatoday.it" 
r = urllib.urlopen(url)
print r.read()

a picture that I captured after running your code.