wget不会下载我可以通过浏览器访问的文件

时间:2018-05-11 11:32:41

标签: web-scraping wget

我是一位试图访问报纸档案的业余历史学家。扫描所在的服务器使用过时的tif查看器“工作”,该查看器似乎根本不再工作。我可以在没有登录的情况下单独访问chrome中的文件,但是当我尝试使用wget或curl时,我被告知查看文件是未经授权的,即使我使用我的登录信息,甚至使用我的Chrome中的cookie。

以下是其中一个文件的示例:https://ulib.aub.edu.lb/nahar/images2/7810W2/78101001.TIF

当我把它放到chrome中时,它会自动下载文件,即使我无法访问目录本身,但是当我使用wget时,我收到以下响应:“401未经授权的用户名/密码验证失败。”

这是我正在使用的基本wget命令(如果我可以让它工作,那么我将输入其他文件的列表):

wget --no-check-certificate https://ulib.aub.edu.lb/nahar/images2/7810W2/78101001.TIF

我尝试使用和不使用Cookie,使用空白用户,使用和不使用登录凭据,我确信你可以说,我是新手,但我很想学习。

0 个答案:

没有答案