如何验证站点地图生成的索引是否返回200个代码?

时间:2011-01-18 16:49:59

标签: scripting sitemap

我为Google生成了Sitemap索引。我唯一的问题是如何验证生成的所有索引(URL)是否有效。根据指南,它说的是这样的:

  

您编写了一个脚本来针对您的应用程序测试站点地图中的每个URL   服务器并确认每个链接都返回HTTP 200(OK)代码。断开的链接可能表示不匹配   在Sitemap生成器的URL格式配置之间

我只是想看看是否有人有过如何编写此类脚本的经验?

2 个答案:

答案 0 :(得分:0)

Google网站管理员工具会在“网站配置 - > sitemaps”内向您报告任何HTTP错误并重定向(几乎所有不是HTTP 200的内容),另外在“诊断 - >抓取错误 - >站点地图”中“是抓取站点地图中列出的网址时发生的错误的另一种观点。

如果那不是你想要的,我会做一些日志文件grep-ing。 (grep for“googlebot”以及您在站点地图中列出的网址标识符)

您可以编写自己的抓取工具来预先检查您的网站是否返回HTTP 200,但是,如果它现在为您返回HTTP 200,并不意味着它将在下周/月为googlebot返回HTTP 200 / 年。所以我建议坚持使用谷歌网站管理员工具和日志文件分析(可视化为:munin,cacti,...)

答案 1 :(得分:0)

您是如何创建站点地图的?我认为大多数站点地图工具只包含以“200 OK”回复的网址

请注意,某些网站会陷入困境并始终以响应200响应而不是例如404表示无效网址。这些网站有问题:)