我正在尝试创建一个从Charon获取代理列表的程序,它看起来像
202.43.178.31:3128
202.109.80.106:8080
193.165.79.13:3128
222.177.13.25:3128
125.40.181.247:8080
222.134.33.146:8080
并使其成为可与代理链一起使用的
http 141.219.252.132 68664
http 118.174.0.155 8080
http 91.194.246.169 8080
http 91.194.246.81 8080
http 201.245.110.138 8888
我这样做了,但我需要一些方法来确定代理类型。 现在我的程序将'http'放在所有内容的前面,最多检查代理是否有效以及是否没有注释掉它。 有关在Python中查找代理类型的建议(并使其尽可能可移植,如不使用任何特定于Linux的工具)?
答案 0 :(得分:1)
一种方法是连接到外部服务器并检索HTTP标头并从中获取信息。您还可以找到一些站点,当您连接到它时检查代理类型并抓取页面以获得答案。
如果没有连接某种服务器,我认为这是不可能的,因为标题不会传回客户端,只传递给服务器。
另一种不太合适的方法可能是尝试连接每种类型的代理并查看哪种代理工作。
我希望这可以帮助你朝着正确的方向发展。