我目前通过点击与此链接上显示的“登录”按钮类似的按钮来下载数据页面的网页:
http://www.cebumode.com/AMWEBLOGIN.aspx
但是,此按钮只是一个开始下载csv报告的“下载”请求。
与手动访问此页面以下载新数据,我正在尝试自动下载报告以提供给我的脚本的过程,但是我无法弄清楚如何确定此“获取”请求的链接或者如何使用wget直接下载文件(也就是说,按钮背后的来源是什么?)
我如何找到这些信息?
我查看了网页来源,找不到任何线索。
答案 0 :(得分:4)
您网页上的相关位是:
<form method="post" action="AMWEBLOGIN.aspx" id="form1">
<input name="txtUsername" type="text" id="txtUsername" style="border-width:1px;border-style:Solid;font-family:Calibri;font-size:14pt;width:250px;" autocomplete="off">
<input name="txtPassword" type="password" id="txtPassword" style="border-width:1px;border-style:Solid;font-family:Calibri;font-size:14pt;width:250px;">
<input type="submit" name="btnLogin" value="Login" id="btnLogin" style="font-family:Calibri;font-size:14pt;">
</form>
它向http://www.cebumode.com/AMWEBLOGIN.aspx发出HTTP-Post请求 使用变量txtUsername和txtPassword。
顺便说一下,这是非常可怕的,因为它传输了用户名&amp;密码为纯文本,并且可能还接收未加密的表单身份验证cookie。
所以wget命令行是这样的:
wget --post-data "txtUsername=$USERNAME&txtPassword=$PASSWORD" --save-cookies cookies.txt --user-agent=Mozilla/5.0 http://www.cebumode.com/AMWEBLOGIN.aspx