我正在尝试使用urllib2打开一个页面,但我不断收到连接超时错误
我使用的线是:
f = urllib2.urlopen(url)
确切错误是:
URLError: <urlopen error [Errno 110] Connection timed out>
答案 0 :(得分:4)
urllib2
尊重robots.txt。许多网站会屏蔽默认User-Agent
。
尝试添加新的User-Agent
,创建Request
个对象&amp;使用它们作为urlopen
的参数:
import urllib2
request = urllib2.Request('http://www.example.com/')
request.add_header('User-agent', 'Mozilla/5.0 (Linux i686)')
response = urllib2.urlopen(request)
有几个详细的演练,例如http://www.doughellmann.com/PyMOTW/urllib2/
答案 1 :(得分:0)
作为一般策略,请打开wireshark并观察urllib2.urlopen(url)
生成的流量。您可能能够看到错误的来源。