如何帮助Google搜索首选具有多个版本的网页的最新版本?

时间:2018-06-20 18:40:57

标签: google-search

与许多软件项目一样,我们的网站上同时维护了当前和历史文档,以减少URL不会随着时间推移而变旧的可能性。我正在努力的是,如何让Google搜索优先使用最新版本的文档,而不是它最初发现的早期版本,尤其是子目录中的文档

作为一个具体的示例,假设我有一个非常简单的文档层次结构,在子目录中有一个根文档文件和一个文档文件,如下所示(实际上,我在每个目录中都有许多子目录和许多文件):

www/docs/
  root.html          ## this is the latest version of root.html, call it 2.0
  subdir/
    docpage.html     ## this is the latest version of docpage.html

  v1.0/              ## this is an older, archived version of the same content
    root.html        ## this is an older version of root.html
    subdir/
      docpage.html   ## this is an older version of docpage.html

从我在网上阅读的内容中,常见的技巧是:(1)如上文所述,将较新的文档版本放在目录层次结构中较浅; (2)仅将最新版本的文档包含在提交给Google的站点地图中。

完成了这两项操作后,我发现,导致root.html的Google搜索现在可以根据需要跟踪最新版本。但是,可能导致子目录(例如docpage.html)中的文件的Google搜索通常仍指向较旧的版本。这使我认为“浅”规则仅适用于在目录层次结构中具有直接祖先关系的文件,而不适用于远亲的文件,就像上面的docpage.html一样。

有关此示例的实际示例,请在Google上搜索指向the latest version的“教堂语言文档”(在撰写本文时为1.17版)。但是,如果您搜索“教堂语言数组”(例如),它将指向an older version(在撰写本文时为1.14),而不是层次结构中较浅且在站点地图中列出的newer version (而不是1.14版本)。

这真令人沮丧,我一直倾向于要求机器人不要使用旧版本的文档,但是我的感觉是Google不想让网站采用这种方法。

0 个答案:

没有答案