我有一个函数,通过使用Python3中的请求库向几个网站发送请求来检查代理是否处于活动状态。我正在尝试确定请求时可用的协议(http,https,socks),但无法弄清楚如何。
这是功能:
import requests
def is_prox(proxy_server):
proxyDict = {"http": proxy_server,
"https": proxy_server,
"socks": proxy_server}
test_site = {"http://www.google.com", "http://whatsmyip.org", "http://www.facebook.com"}
headers = {'user-agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5 (.NET CLR 3.5.30729)'}
for site in test_site:
try:
r = requests.get(site, headers=headers, proxies=proxyDict)
status = r.status_code
if status is 200:
print(status)
else:
pass
except Exception as e:
print(str(e))
if __name__ == '__main__':
is_prox("http://149.56.232.18:3128")
和输出:
$>python3 proxcheck.py
200
但我希望输出为:200 - http
或200 - https
,或者使用的协议。
我已尝试requests.utils.getproxies()
和requests.utils.get_environ_proxies(url)
,但这不是我想要的。
我知道这是一本字典,但我无法弄清楚如何列出哪个字典元素正在返回200
。
任何人都可以帮助我吗?
答案 0 :(得分:1)
使用 t.m.adam 的建议,我能够产生我想要的结果。我没有让请求遍历代理,而是设置 for 循环来遍历字典并返回返回 200 的代理。
这是带有固定代码的更新函数:
import requests
def is_prox(proxy_server):
proxyDict = {"http": proxy_server,
"https": proxy_server,
"socks": proxy_server}
test_site = "http://api.ipify.org/?format=json"
headers = {'user-agent': 'Mozilla/'
'5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.5) Gecko/'
'20091102 Firefox/'
'3.5.5 (.NET CLR 3.5.30729)'}
for proxy in proxyDict:
try:
r = requests.get(test_site, headers=headers, proxies=proxy)
status = r.status_code
if status is 200:
print(str(status) + " - " + str(proxy.upper())
except Exception as e:
pass
if __name__ == '__main__':
is_prox("http://149.56.232.18:3128")
返回:
200 - SOCKS