网页监控问题

时间:2011-06-13 19:03:33

标签: asp.net html monitoring

有许多不同的网站可让您监控特定网页的任何更改,例如watchthatpage.com或page2rss.com

我对这些网站的工作方式感兴趣,这意味着他们如何确定某些网页是否已更新。他们只是复制页面中的所有文本,将其存储在内存中,然后将其与网站页面的内容进行比较吗? 或者他们可能会寻找一些特定的html元素并比较它们的值?

请帮我找到答案。

3 个答案:

答案 0 :(得分:2)

答案 1 :(得分:0)

我怀疑他们存储了整个内容,每次检查时都会进行比较。如果不同,发送警报,否则不发送。

答案 2 :(得分:0)

有两种方法可以做到这一点。

首先是拉HTML并做一个简单的string.compare。

第二种方式是做HEAD请求见第9.4节here