了解谷歌目前如何看待我们的网站并且缩短... 基本上,我们使用bog标准的URL重写结构,使它们看起来很友好。
例如,产品网址的形式为any string_([0-9]).html
,依此类推。当然,这允许我们在产品ID之前链接到我们想要的任何东西......我们已经完成了。过去,产品页面为Product_Name_79.html
,然后成为Brand_Name_Product_Name_79.html
。在任何一种情况下,apache都不关心并且id 79被传递。但是,谷歌现在有两个版本的这个产品缓存在不同的URL下 - 这不是一件好事,因为它继续到达第一个URL并蜘蛛它。
同样适用于我们对品牌和类别的重写规则,其中一些已被删除,其中一些已被修改。
site:domain
中有超过11k的网址,而我们的网站地图只有5.8k。您如何防止蜘蛛获取您不再链接的旧版本网址(考虑到它不是手动过程,而且这些网址通常非常动态)。
例如,Mens_Merrell_Trail_Running_Shoes__50-100__10____024/
是merrell
品牌的动态网址,缩小了trail running shoes
中费用介于50 and 100
和size 10
之间且性别设置的项目到men's
。
如果我们决定nofollow
任何尺寸和金钱过滤网址,那么google仍然可以通过其旧缓存访问它们......
禁止使用特定类型的网址的最佳做法是什么?由于上面的组合几乎是无限的,我无法生成一个列表,它肯定不能回溯谷歌可能为我们历史上持有的品牌和类别。
在应用此类过滤器时,我们应该添加无索引吗?我们应该将它们导出到robots.txt吗?什么都不做,希望谷歌停止返回?
从透视角度来看,我们有2600个产品页面网址,现在是冗余/禁用的,你会用它们做什么?重定向到主页,品牌页面,404,什么都不做?
感谢任何建议
答案 0 :(得分:2)
我认为你正在寻找rel="canonical",谷歌应该开始忽略你的链接,如果他们真的没有链接。您可以使用以下工具检查任何传入链接:http://www.seomoz.org/linkscape。
此外,如果你的旧网址匹配(或不匹配)一个consisent模式,你可以在apache中设置301重定向,用于匹配旧模式或不匹配新模式的页面......
希望这有帮助!
答案 1 :(得分:0)
请确保为您更改的任何网址设置重定向。此外,我不建议使用rel = nofollow,因为它向Google表明您的网站不值得信任。