我想使用代码与python 3的urllib。但是我遇到了问题。
import urllib
Header = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X vAppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
URL = "https://www.sth.com/"
proxy_support = urllib.request.ProxyHandler({'http' :'52.170.21.0:3128'})
opener = urllib.request.build_opener(proxy_support)
urllib.request.install_opener(opener)
req = urllib.request.Request( url=URL ,headers=Header, data=None)
ans_object = urllib.request.urlopen(req)
第一个问题:我找不到如何在ProxyHandler中使用IP地址的指南。所以我不知道这是否支持工作。但假设它应该工作:
我不知道如何解决我的请求是否使用代理。我尝试了(UNDOCUMENTED !!!!!!!这个方法在官方文档中没有入口)方法.has_proxy()并返回FALSE。
那么如何检查我的脚本是否使用代理?
我还尝试使用request.set_proxy(host,type)方法。 根据文档,它应该将request.host设置为“host”,将request.selector设置为完整的url。但是当我使用
时req.set_proxy('52.170.21.0:3128','https')
我只得到“/”作为req.selector的结果。
我发现官方文档几乎缺乏。
感谢您的帮助