如何提取受密码保护的Web Wiki页面?

时间:2010-01-24 12:36:37

标签: wiki ssl-certificate wget

我希望获得一些网页和受密码保护的子链接。我有用户名和密码,可以从普通的浏览器UI访问它们。但是,由于我希望将这些页面保存到本地驱动器以供日后参考,我使用WGET来获取它们:

wget --http-user=USER --http-password=PASS http://mywiki.mydomain.com/myproject

但是上面的内容不起作用,因为它再次要求输入密码。有没有更好的方法来做到这一点,而不会再次遇到系统要求输入密码。此外,获取特定页面上的所有链接和子链接并将其存储到单个文件夹的最佳选择是什么。

更新: 我尝试访问的实际页面位于HTTPS网关后面,并且相同的证书未经过验证。有没有办法解决这个问题?

mysystem-dsktp ~ $ wget --http-user=USER --http-password=PASS https://secure.site.mydomain.com/login?url=http://mywiki.mydomain.com%2fsite%2fmyproject%2f
--2010-01-24 18:09:21--  https://secure.site.mydomain.com/login?url=http://mywiki.mydomain.com%2fsite%2fmyproject%2f
Resolving secure.site.mydomain.com... 124.123.23.12, 124.123.23.267, 124.123.102.191, ...
Connecting to secure.site.mydomain.com|124.123.23.12|:443... connected.
ERROR: cannot verify secure.site.mydomain.com's certificate, issued by `/C=US/O=Equifax/OU=Equifax Secure Certificate Authority':
  Unable to locally verify the issuer's authority.
To connect to secure.site.mydomain.com insecurely, use `--no-check-certificate'.
Unable to establish SSL connection.

我也试过了--no-check-certificate选项,它不能正常工作。我只获得带有此选项的登录页面,而不是我请求的实际页面。

2 个答案:

答案 0 :(得分:1)

你能尝试这样吗?

wget http://USER:PASSWD@mywiki.mydomain.com/myproject

答案 1 :(得分:0)

似乎您正在尝试访问由表单保护的页面。

您可以使用该--no-check-certificate选项并关注此论坛帖子建议:Can't log in with wget