如何检查动态网页是否已更新?

时间:2014-01-29 13:53:18

标签: timestamp timestamping

我知道我可以用

检查上次修改时间
wget -S http://www.staticpage.com

只要页面是静态的。但是当对动态页面做同样的事情时,我总能得到现在的时间。

那么,如果页面在任意时间或最后一次更新页面时发生了变化,那么询问网站的不那么干扰的方式是什么?我显然可以下载整个页面并与我在文件中保存的内容进行比较,但我希望减少开销。

1 个答案:

答案 0 :(得分:1)

动态页面实际上是更新每个页面加载。如果您想知道动态页面何时更新,您将需要查看页面本身或页面的RSS源。你最好的选择通常是下载它并从最新的帖子中解析出最新的日期。

更新: 如果要限制下载页面时读取的数据量,可以使用以下内容:

curl http://someurl.com | head -c 512

Linux将停止从流中读取并在512字节后使用此结束请求。由服务器来查看并停止传输。这可能会也可能不会发生,但至少你不会浪费更多的带宽。