我有一个PDF文件,它几乎每天(几乎)以相同的名称和相同的网址发布。
我想做的是:
PS:我有一台安装了CURL
和WGET
的Mac。
谢谢!
答案 0 :(得分:0)
此处的解决方案是时间戳:http://www.gnu.org/software/wget/manual/html_node/Time_002dStamping.html#Time_002dStamping
使用wget-N每12小时设置一个cron作业应该可以解决问题。这将检查PDF的标题,看它是否是新的,如果不是则不下载。由于它将使用PDF的时间戳下拉,您可以编写一个bash脚本来获取ls -l的输出,查找mtime,并使用它来重命名该文件。