我想抽样一个论坛的主页来做一些统计。主页仅对注册会员可见。我如何使用wget下载它?我尝试通过浏览器登录,然后将浏览器的cookie文件传递给wget,但它不起作用。
编辑:这是登录表单代码:
<table border="0" cellpadding="3" cellspacing="1" width="100%">
<tr>
<td colspan="2" align="center"> </td>
</tr>
<tr>
<td width="45%" align="right"><span class="gen">User:</span></td>
<td><input type="text" name="username" size="25" maxlength="40" value="" class="post2" id="focus" onFocus="Active(this)" onBlur="NotActive(this)" /></td>
</tr>
<tr>
<td align="right"><span class="gen">Password:</span></td>
<td><input type="password" name="password" size="25" maxlength="25" class="post2" onFocus="Active(this)" onBlur="NotActive(this)" /></td>
</tr>
<tr align="center">
<td colspan="2"><span class="gen">Remember me: <input type="checkbox" name="autologin" /></span></td>
</tr>
<tr align="center">
<td colspan="2"><input type="hidden" name="redirect" value="" /><input type="submit" name="login" class="mainoption" value="Log in" /></td>
</tr>
<tr align="center">
<td colspan="2"><span class="gensmall"><a href="profile.php?mode=sendpassword" class="gensmall">I forgot the password</a></span></td>
</tr>
</table>
答案 0 :(得分:0)
Wget接受一些参数,例如--http-user = user --http-passwd = password,除了代理和证书方法。你尝试过其中一种吗?
论坛认证如何运作?
答案 1 :(得分:0)
查看该页面中登录表单的构造。如果它是典型的POST表单,则检索构成表单的元素的名称,并构造一个wget查询,该查询将这些查询传递给表单提交到的页面
在此示例中,表单字段称为“用户名”和“密码”:
wget http://www.myforum.com/login.php --post-data =“username = jeffrey&amp; password = mypassword”
您只需下载登录页面。通过其他wget选项的一些配置,您应该能够让它遍历主页并下载它(特别是如果在帖子登录页面上有链接)。您甚至可能会很幸运,您的论坛会在登录后自动将您重定向到主页面;在这种情况下,wget将在那时为您下载(取决于服务器发出的重定向类型)。