我正在寻找一个让我粗略的lib:
我知道http://betterinternet.co/已经这样做了,但由于某些原因他们不会给我他们的源代码。
我认为这不作为免费代码存在,所以如果我要写一个,那么它有什么细微差别吗?如果我在html和标题中替换所有出现的somesite.com,那就足够了吗?
答案 0 :(得分:4)
所以...你想要一个链接重写的http代理吗?听起来像Apache和mod_proxy_html。它不是用节点或Python编写的,但我认为它会做你想要的。
答案 1 :(得分:1)
我没有看到任何直接的问题解决方案。如果我理解正确,你需要一个缓存HTTP代理,它在本地提供静态内容,并在Python(或nodejs)中定义URL重写规则。这是一项艰巨的任务。
缓存HTTP代理实现并非易事。所以我会使用现有的实现,例如Squid(或Apache,如果它也进行缓存)。
然后你可以放置一个用Python编写的(相对)简单的HTTP服务器(例如基于BaseHTTPServer
和urllib2
),它根据需要执行URL重写并转发请求代理(或直接上网)。
我们的想法是依靠代理设置来执行您不想修改的所有处理(包括基本重写规则,身份验证,缓存和缓存管理),并限制您的前端实现仅执行自定义重写您感兴趣的。