关于sitemap_index.xml的困惑

时间:2009-03-27 14:02:51

标签: seo sitemap

我已经在网站地图格式上阅读了Google文档,但有一件事他们不清楚: 搜索引擎会自动查找并查找/sitemap_index.xml,还是必须通过/robots.txt或主/sitemap.xml告诉他们?您可以拥有/sitemap.xml并仍然可以依赖/sitemap_index.xml进行查找和收获吗?

4 个答案:

答案 0 :(得分:10)

在robots.txt中,您可以使用相同的语法指向站点地图或站点地图索引文件:

Sitemap: <location>

搜索引擎会通过查看文件知道它是什么类型。

值得注意的是,sitemap.xml和sitemap_index.xml只是建议的文件名,您可以使用任何您想要的名称。与robots.txt的已知位置不同,搜索引擎不会检查任何位置,例如sitemap.xml或sitemap_index.xml,而不会告诉它该位置有什么内容。

答案 1 :(得分:6)

最好的方法是在robots.txt中指向您的站点地图:

Sitemap: <sitemap_location>

www.sitemaps.org

对此有很好的解释

答案 2 :(得分:6)

我已经阅读了很多关于这个问题的讨论,没有人知道Google如何处理这个问题。

有些人说抓取工具默认会查找这些文件:

  • /sitemap.xml
  • /sitemap.xml.gz
  • /sitemap.gz

如果您阅读Google关于xml-sitemaps的文章,他们经常谈论这些文件名,这是巧合吗?

也许这是真的,但是,我建议您遵循Google指南并使用robots.txt +通过Google Webmaster Tools提交站点地图。

我认为网站管理员工具被低估,非常值得,您可以直接从Google接收信息,这些信息可以帮助您改善网站。

如果您不希望每次登录网站管理员工具以在更新时重新提交站点地图,您可以ping Google以告知他们有关更改的信息。

ping Google的链接:www.google.com/webmasters/tools/ping?sitemap = sitemap_url

Google Support的更多信息。

答案 3 :(得分:2)

我可以确认,对于我刚调查过的两个网站,网站管理员工具没有sitemap_index.xml或其链接的站点地图的记录。

我检查过的网站都被谷歌索引了一年多,没有提到robots.txt中的站点地图,而且是由Yoast SEO自动生成的sitemap_index.xml的WordPress站点。我刚刚在网站站长工具中手动添加了站点地图。