大家好!使用firefox插件我可以捕获标头。我想在python中执行它:我需要将浏览器代理设置更改为localhost:8080(或任何端口),然后浏览器发出的每个请求都应该通过我的机器上实际运行的python脚本。此脚本应该能够捕获标题,捕获网页中的链接等。我知道Web应用程序扫描程序会这样做,但我怎么能在python中执行此操作。你能建议任何一个起点,阅读吗?我只想了解它并实施一个。
答案 0 :(得分:3)
看看python-proxy。谷歌搜索"python proxy"也会产生大量的结果。
如果你想从头开始写一个,那也不是太难。您可以使用BaseHTTPServer
来监听新连接,通过SocketServer.ThreadingMixIn
将其设置为多线程,然后实施do_GET
和do_CONNECT
(可能还有do_POST
和{{1} })。在这些方法中,您需要从do_HEAD
中提取URL,向该URL发送HTTP请求(最好使用requests
包,它比urllib更舒服)并将响应发送回客户端。