好的,我试过用几个不同的库来解决这个问题。我正在编写一个脚本来查看数千个网站,并在页面上显示特定项目。我需要能够重置连接,以便脚本继续运行而不会丢失任何数据。我已经尝试捕获错误并等待,但似乎没有解决它,因为它最终导致脚本完全错误。我在状态检查模块中的以下代码片段中收到错误。
def status(url): #checks the response code
try:
req=urllib2.urlopen(url)
response=req.getcode()
return response
except urllib2.HTTPError, e:
return e.code
print e.code
except urllib2.URLError, e:
print e.args
return e.args
但在尝试之前我使用下面的代替urrlib2
parsedurl = urlparse(url)
conn = httplib.HTTPConnection(parsedurl.netloc)
conn.request('HEAD',parsedurl.path)
response = conn.getresponse()
return response.status