Question

以下问题：我正在尝试下载一个包含pdf的目录，并且它下载文件结构，一些pdf，但不比第二个目录更深入地下载pdf。

细节（理论上）

所以我有folder1 / folder2 / folder3（/ folder4 / folder5）

folder1 不包含pdf，但其中包含的文件结构已下载。

文件夹2 包含另一个文件夹和一些pdf，已创建文件夹，已下载pdf

文件夹3 有时包含更多文件夹，这些文件夹已创建，但其中和子文件夹中包含的所有pdf均未下载。

这是我用来下载所有内容的内容：

wget -r -l inf --no-remove-listing -np -c -w 3 --no-check-certificate -R "index.html*" -P "target directory" "https://etc./"

我在做什么错？

Answer 1

解决了它：-erobots = off是解决方案。这很奇怪，因为该站点实际上是我不同意的wget命令，但仍然尝试过并且比我自己的命令具有更少的结果，反正-erobots = off在其原始代码中未提及，因此我想出了，但我没有不需要它，但是我做到了。