如何从通过代理传输的数据包中替换URL?

时间:2012-04-08 21:39:01

标签: python http proxy

我在python中为自己的代理服务器编写代码。从客户端和目标服务器传输数据包的代码如下:

def _read_write(self):
        if self.target:
            pass
        else:
            domain, port = self.get_target_host()
            self._connect_target(domain, port)

        self.target.send(self.headers)

        maxtimeout = self.timeout / 3
        inputs = [self.client, self.target]
        count = 0
        try:

            while 1:
                count += 1
                (recv, send, err) = select.select(inputs, [], inputs)

                if err:
                    break

                if recv:
                    for in_ in recv:
                        data = in_.recv(BUFFLEN)

                        if in_ is self.client:
                            out = self.target
                        else:
                            out = self.client

                        if data:
                            out.send(data)
                            count = 0
                if count == maxtimeout:
                    break
        except select.error:
            print >> sys.stderr, "Error : Internal queue error\n", "Reason : Unknown"

现在,由于每个数据包都是从客户端单独传输到服务器,我想拦截正在传输的数据,并用一些新的URL替换图像,css等资源的URL,其中最近的服务器来自客户端。这是正确的方法吗?如果URL被数据包分开,我想我会遇到问题。

1 个答案:

答案 0 :(得分:0)

对 - 在数据包级别上很难做到这一点。可能更容易的是首先在代理中构建整个数据,然后进行处理,然后将数据发送到客户端。