以下问题:我正在尝试下载一个包含pdf的目录,并且它下载文件结构,一些pdf,但不比第二个目录更深入地下载pdf。
细节(理论上)
所以我有folder1 / folder2 / folder3(/ folder4 / folder5)
folder1 不包含pdf,但其中包含的文件结构已下载。
文件夹2 包含另一个文件夹和一些pdf,已创建文件夹,已下载pdf
文件夹3 有时包含更多文件夹,这些文件夹已创建,但其中和子文件夹中包含的所有pdf均未下载。
这是我用来下载所有内容的内容:
wget -r -l inf --no-remove-listing -np -c -w 3 --no-check-certificate -R "index.html*" -P "target directory" "https://etc./"
我在做什么错?
答案 0 :(得分:0)
解决了它:-erobots = off是解决方案。这很奇怪,因为该站点实际上是我不同意的wget命令,但仍然尝试过并且比我自己的命令具有更少的结果,反正-erobots = off在其原始代码中未提及,因此我想出了,但我没有不需要它,但是我做到了。