使用基于特定查询字符串的wget镜像网站

时间:2013-11-23 00:42:02

标签: unix wget

我正在尝试使用以下网址格式镜像网站:

http://example.com/homepage?page=1

我想只镜像使用查询字符串从page = 1到page = 100的那些。如何使用wget尽可能高效地完成此任务?

我不需要递归镜像,只需要1到100页。保存CSS / JS也不错。排除图像也很棒,以保持快速(仅对文本感兴趣)。

帮助?

1 个答案:

答案 0 :(得分:2)

创建网址列表:

seq 1 100 | xargs -n 1 -I {} echo http://example.com/homepage?page={} > URLS.txt

然后使用wget:

下载所有内容
wget -i URLS.txt