在镜像网站时仅复制更改的文件

时间:2012-12-10 10:59:50

标签: php javascript web-applications curl wget

我使用wget使用此代码镜像网站

$ wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains website.org \
     --no-parent \
         www.website.org/tutorials/html/

下次我运行它时会再次开始下载相同的文件,但我希望下次只下载更改的文件。除了使用wget之外,我愿意使用任何其他工具或脚本(最好是PHP,Curl)。

2 个答案:

答案 0 :(得分:2)

这是rsync的量身定制的工作。见man rsync

您可以使用:

rsync -avz <source> <destination>

答案 1 :(得分:0)

尝试使用选项--timestamping进行增量下载。另请参阅wget manual以获取更多信息。