我知道我可以用
检查上次修改时间wget -S http://www.staticpage.com
只要页面是静态的。但是当对动态页面做同样的事情时,我总能得到现在的时间。
那么,如果页面在任意时间或最后一次更新页面时发生了变化,那么询问网站的不那么干扰的方式是什么?我显然可以下载整个页面并与我在文件中保存的内容进行比较,但我希望减少开销。
答案 0 :(得分:1)
动态页面实际上是更新每个页面加载。如果您想知道动态页面何时更新,您将需要查看页面本身或页面的RSS源。你最好的选择通常是下载它并从最新的帖子中解析出最新的日期。
更新: 如果要限制下载页面时读取的数据量,可以使用以下内容:
curl http://someurl.com | head -c 512
Linux将停止从流中读取并在512字节后使用此结束请求。由服务器来查看并停止传输。这可能会也可能不会发生,但至少你不会浪费更多的带宽。