应用错误收集

时间：2012-09-12 08:29:05

标签： python urllib2

我正在尝试使用urllib2获取网站的HTML内容。该网站有一个 onload event 正文，可以在此网站上提交表单，因此会转到目标网站并呈现我需要的详细信息。

response = urllib2.urlopen（'www.xyz.com?var=999-999'）

www.xyz.com包含一个发布到“www.abc.com”的表格动作值取决于url'var = 999-999'中的内容这意味着如果var值变为，则动作值将发生变化 '888-888'

response.read（）

这仍然给了我“www.xyz.com”的html内容，但我想要由此产生的动作网址。任何获取html的建议最后一页的内容？

提前致谢

答案 0 :(得分：1)

你必须弄清楚第二页的调用，包括发送的参数，这样你就可以从你的python代码中自己调用，最好的方法是在打开谷歌浏览器页面检查器的情况下浏览第一页，然后转到网络选项卡。将捕获POST呼叫，您可以看到发送的参数和所有参数。然后只需从urllib2重新创建相同的POST调用。