如何使用Wget或Curl自动化和重命名(根据服务器日期)文件下载

时间:2012-10-18 23:18:50

标签: curl wget

我有一个PDF文件,它几乎每天(几乎)以相同的名称和相同的网址发布。

我想做的是:

  1. 仅在远程文件更新时才下载文件(这对我来说很难,因为即使更新文件也始终保持相同的名称,可以检查文件大小吗?);
  2. 根据服务器的日期重命名文件(不是我的系统日期:我与服务器有9小时的差异);
  3. 自动化脚本以每12小时检查一次文件。
  4. PS:我有一台安装了CURLWGET的Mac。

    谢谢!

1 个答案:

答案 0 :(得分:0)

此处的解决方案是时间戳:http://www.gnu.org/software/wget/manual/html_node/Time_002dStamping.html#Time_002dStamping

使用wget-N每12小时设置一个cron作业应该可以解决问题。这将检查PDF的标题,看它是否是新的,如果不是则不下载。由于它将使用PDF的时间戳下拉,您可以编写一个bash脚本来获取ls -l的输出,查找mtime,并使用它来重命名该文件。