我想定期对远程网页进行哈希处理,然后比较当前哈希值和先前哈希值,以了解是否有任何更改。
为此,我正在使用 wget
命令以递归方式检索数据。
我的要求是,仅当最终用户在其浏览器中查看的网页内容发生某些更改时,才需要获取其他哈希值。
如果我执行一个简单的wget命令,如
wget --recursive --page-requirements --convert-links URL/TO/WEBPAGE
响应将在标头中包含时间戳,并且每次都会得到不同的哈希值。
在cURL
中,我可以设置一个选项以不获取任何标题作为响应,但是我不知道如何在wget
中实施该标题?
所以问题是,我该怎么做才能使对wget
命令的响应带来任何标题?
答案 0 :(得分:0)
将网页存储在文件中,然后使用该文件来计算您的哈希值。
wget --recursive --page-requirements --convert-links -O /tmp/wget.txt URL/TO/WEBPAGE
md5sum /tmp/wget.txt