我正在开发一个项目,使用python和基于Web的代理 机械化。我有个问题 : 机械化返回的页面具有不是的URL 机械化,如果用户点击它,他们将通过链接 他们自己的计算机的IP(不是我的代码安装在其上的服务器)。有没有办法解决这个问题?
答案 0 :(得分:0)
您可以通过使用lxml解析HTML,美丽的汤等来重写URL,然后重写它们并将DOM重新转储到字符串,然后再将其发送给用户。或者通过搜索带有正则表达式的URL,并返回重写的HTML。
请记住,使用javascript等生成的链接正确地执行此操作几乎是不可能的。
这就是人们使用代理服务器的原因。