应用错误收集

如何让wget下载整个子网站而不下载整个网站

时间：2019-05-20 20:29:59

标签： web wget downloading

我需要下载和存档大约50个子网站（包括该子网站内的所有工作链接），这些子网站是作为公司主门户网站的一部分创建的。我需要wget来下载子站点，而不必下载整个站点。

从搜索的角度来看，这是我到目前为止已经尝试过的

wget --mirror --page-conditions --convert-links --recursive --adjust-extension --compression = auto --reject-regex“ / search | / rss” --no-if-modified-自--no-check-certificate --user = xxxxxxx --password = xxxxxxx

这反而下载了每个子站点的主页，而没有任何实际的链接。

1 个答案:

答案 0 :(得分：2)

您应该添加--no-parent以限制到所需的部分。

示例行为wget --mirror --convert-links --page-requisites ----no-parent -P /path/to/download https://example-domain.com。

由wget下载，没有特定的文件夹站点
下载整个动态网站
如何使用wget下载整个目录和子目录？
如何下载整个网站数据库
当url有参数时，如何用wget下载整个页面？
Wget Curl - 下载整个网站并运行concordance
如何使用go lang下载和保存整个网页
如何使用wget下载整个动态页面？
带有授权的递归下载站点
如何让wget下载整个子网站而不下载整个网站

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？