以论坛用户身份获取论坛

时间:2011-02-19 13:59:55

标签: authentication cookies download wget

我想抽样一个论坛的主页来做一些统计。主页仅对注册会员可见。我如何使用wget下载它?我尝试通过浏览器登录,然后将浏览器的cookie文件传递给wget,但它不起作用。

编辑:这是登录表单代码:

            <table border="0" cellpadding="3" cellspacing="1" width="100%">
                <tr>

                    <td colspan="2" align="center">&nbsp;</td>
                </tr>
                <tr>
                    <td width="45%" align="right"><span class="gen">User:</span></td>
                    <td><input type="text" name="username" size="25" maxlength="40" value="" class="post2" id="focus" onFocus="Active(this)" onBlur="NotActive(this)" /></td>
                </tr>
                <tr>
                    <td align="right"><span class="gen">Password:</span></td>

                    <td><input type="password" name="password" size="25" maxlength="25" class="post2" onFocus="Active(this)" onBlur="NotActive(this)" /></td>
                </tr>
                                <tr align="center">
                    <td colspan="2"><span class="gen">Remember me: <input type="checkbox" name="autologin" /></span></td>
                </tr>
                                <tr align="center">
                    <td colspan="2"><input type="hidden" name="redirect" value="" /><input type="submit" name="login" class="mainoption" value="Log in" /></td>
                </tr>

                <tr align="center">
                    <td colspan="2"><span class="gensmall"><a href="profile.php?mode=sendpassword" class="gensmall">I forgot the password</a></span></td>
                </tr>
            </table>

2 个答案:

答案 0 :(得分:0)

Wget接受一些参数,例如--http-user = user --http-passwd = password,除了代理和证书方法。你尝试过其中一种吗?

论坛认证如何运作?

答案 1 :(得分:0)

查看该页面中登录表单的构造。如果它是典型的POST表单,则检索构成表单的元素的名称,并构造一个wget查询,该查询将这些查询传递给表单提交到的页面

在此示例中,表单字段称为“用户名”和“密码”:

wget http://www.myforum.com/login.php --post-data =“username = jeffrey&amp; password = mypassword”

您只需下载登录页面。通过其他wget选项的一些配置,您应该能够让它遍历主页并下载它(特别是如果在帖子登录页面上有链接)。您甚至可能会很幸运,您的论坛会在登录后自动将您重定向到主页面;在这种情况下,wget将在那时为您下载(取决于服务器发出的重定向类型)。