我正在尝试使用urllib2获取网站的HTML内容。该网站有一个 onload event 正文,可以在此网站上提交表单,因此会转到目标网站并呈现我需要的详细信息。
response = urllib2.urlopen('www.xyz.com?var=999-999')
www.xyz.com包含一个发布到“www.abc.com”的表格 动作值取决于url'var = 999-999'中的内容 这意味着如果var值变为,则动作值将发生变化 '888-888'
response.read()
这仍然给了我“www.xyz.com”的html内容,但我想要 由此产生的动作网址。任何获取html的建议 最后一页的内容?
提前致谢
答案 0 :(得分:1)
你必须弄清楚第二页的调用,包括发送的参数,这样你就可以从你的python代码中自己调用,最好的方法是在打开谷歌浏览器页面检查器的情况下浏览第一页,然后转到网络选项卡。将捕获POST呼叫,您可以看到发送的参数和所有参数。然后只需从urllib2重新创建相同的POST调用。