检查网页已更新的日期?

时间:2009-04-29 09:20:35

标签: asp.net

我希望能够运行一个小脚本,我可以填充一个URL列表,它会拉入并检查页面上次更新的时间?有没有人这样做过?

我只能通过将其粘贴到浏览器URL字段

中找到使用JavaScript的手动方式
javascript:alert(document.lastModified)

任何想法都很受欢迎:)

3 个答案:

答案 0 :(得分:0)

如果您在python脚本中使用urllib2(或者可能更好httplib),您可以检查the headers that are returned以获取最后修改的字段。

答案 1 :(得分:0)

以下内容将逐步显示一系列网址,并显示上次修改日期,如果不存在,则显示服务器请求的日期。

string[] urls = { "http://boflynn.net", "http://slashdot.org" };
foreach ( string url in urls )
{
    System.Net.HttpWebRequest req =
        (System.Net.HttpWebRequest) System.Net.WebRequest.Create(url);
    System.Net.HttpWebResponse resp =
        (System.Net.HttpWebResponse) req.GetResponse();
    Console.WriteLine("{0} - {1}", url, resp.LastModified);
}

答案 2 :(得分:0)

这取决于“最后更新”的含义。当然,有Last-Modified HTTP标头,但它可能会产生误导。例如,如果页面是动态提供的,那么这个字段将是当前时间的一个很好的变化,即使页面本身的内容(对人类有用的部分)在相当长的时间内没有更新。这个页面本身就是这种现象的一个很好的例子。

如果您对上次内容的更新感兴趣,那么我没有立即回答。