如何强制WGET命令在响应中不带任何时间戳?

时间:2018-09-11 08:57:08

标签: http curl https http-headers wget

我想定期对远程网页进行哈希处理,然后比较当前哈希值和先前哈希值,以了解是否有任何更改。

为此,我正在使用 wget 命令以递归方式检索数据。

我的要求是,仅当最终用户在其浏览器中查看的网页内容发生某些更改时,才需要获取其他哈希值。

如果我执行一个简单的wget命令,如

wget --recursive --page-requirements --convert-links URL/TO/WEBPAGE

响应将在标头中包含时间戳,并且每次都会得到不同的哈希值。

cURL中,我可以设置一个选项以不获取任何标题作为响应,但是我不知道如何在wget中实施该标题?

所以问题是,我该怎么做才能使对wget命令的响应带来任何标题?

1 个答案:

答案 0 :(得分:0)

将网页存储在文件中,然后使用该文件来计算您的哈希值。

wget --recursive --page-requirements --convert-links -O /tmp/wget.txt URL/TO/WEBPAGE
md5sum /tmp/wget.txt