您能告诉我如何使用C# language
找到网页的年龄。例如,如果我想在我的C#程序中找到此en.wikipedia.org/wiki/ATI_Technologies
网站的年龄(首次创建/上传到网络的那一天),我该怎么做?请告诉我这些活动会是什么?
答案 0 :(得分:3)
我不相信有任何可靠的方法可以做到这一点。您需要指望在页面的元数据中具有该发布者的发布者,而不是每个人都这样做。
答案 1 :(得分:0)
您可以在HTTP响应标头中查看Last-Modified
。
答案 2 :(得分:0)
http://archive.org拥有您需要的信息,您可以要求他们使用网络服务。
答案 3 :(得分:0)
如果仅针对维基百科的文章 - 您点击右上角的“查看历史记录”,第一个条目显示日期:2004年7月29日15:29 http://en.wikipedia.org/w/index.php?title=ATI_Technologies&dir=prev&action=history
答案 4 :(得分:0)
没有办法以高度自信的方式获取数据。 WhoIs,archive.org(感谢HarHaHu,我会忘记那个),只是询问网站的所有者可能会在某种程度上发挥作用,但最初的发布日期是单个文件或URL不会自动安全地保存在任何地方,即使在主机的机器上也是如此。维基百科和许多其他网站确实在其大多数页面上维护档案和历史信息,但您必须相信它们不会在任何地方捏造数据
每页历史存档将是一项大规模的工作,如果没有这样的存在,您正在寻找的数据根本就没有任何细节/可靠性。关于这甚至意味着什么有一些含糊之处:您是否跟踪特定URL何时开始响应200的响应代码?你跟踪个别文件?如果网站重新定位,是新页面还是旧页面,该怎么办?正确定义是一个难题,而且几乎不可能完全解决。