用于Web浏览器的本地python代理

时间:2012-05-18 09:26:54

标签: python localhost web-crawler proxy-server

大家好!使用firefox插件我可以捕获标头。我想在python中执行它:我需要将浏览器代理设置更改为localhost:8080(或任何端口),然后浏览器发出的每个请求都应该通过我的机器上实际运行的python脚本。此脚本应该能够捕获标题,捕获网页中的链接等。我知道Web应用程序扫描程序会这样做,但我怎么能在python中执行此操作。你能建议任何一个起点,阅读吗?我只想了解它并实施一个。

1 个答案:

答案 0 :(得分:3)

看看python-proxy。谷歌搜索"python proxy"也会产生大量的结果。

如果你想从头开始写一个,那也不是太难。您可以使用BaseHTTPServer来监听新连接,通过SocketServer.ThreadingMixIn将其设置为多线程,然后实施do_GETdo_CONNECT(可能还有do_POST和{{1} })。在这些方法中,您需要从do_HEAD中提取URL,向该URL发送HTTP请求(最好使用requests包,它比urllib更舒服)并将响应发送回客户端。