如何在python中通过mechanize来机械化返回页面中的url?

时间:2012-06-03 09:29:25

标签: python mechanize

我正在开发一个项目,使用python和基于Web的代理 机械化。我有个问题 : 机械化返回的页面具有不是的URL 机械化,如果用户点击它,他们将通过链接 他们自己的计算机的IP(不是我的代码安装在其上的服务器)。有没有办法解决这个问题?

1 个答案:

答案 0 :(得分:0)

您可以通过使用lxml解析HTML,美丽的汤等来重写URL,然后重写它们并将DOM重新转储到字符串,然后再将其发送给用户。或者通过搜索带有正则表达式的URL,并返回重写的HTML。

请记住,使用javascript等生成的链接正确地执行此操作几乎是不可能的。

这就是人们使用代理服务器的原因。