我在Jetty网络服务器上使用JBoss Seam,并且当它们出现在Google搜索中时,查询参数会出现一些问题。
第一个参数是JBoss Seam用于跟踪对话,cid或conversationId的参数。这是一个小问题,因为谷歌抱怨我提交的网站信息相同。
其次,通过Google网站管理员API发布/删除网址而不是通过网站地图发布/删除是否有意义?
沃尔特
答案 0 :(得分:4)
Hey Walter,我建议你使用rel = canonical标签告诉搜索引擎忽略你的URL字符串中的某些参数。规范标签是谷歌,雅虎和微软承诺支持的通用标准。
例如,如果JBoss正在创建如下所示的URL:mysite.com?cid = FOO& contversationId = BAR,那么您可以在网站的部分创建一个规范标记,如下所示:
<html>
<head>
<link rel="canonical" href="http://mysite.com" />
</head>
</html>
搜索引擎将使用此信息将您网站上的网址规范化为规范(或最短和最权威)版本。具体来说,他们会将此视为从HTTP请求的URL到规范标记中指定的URL的301重定向(只要您没有做任何愚蠢的事情,例如使其成为无限循环,或者指向一个URL,不存在)。
虽然规范标签很酷,但它只有90%的解决方案,因为您仍然可以通过网站上的所有额外参数来解决指标跟踪问题。最佳解决方案是更新基础架构以捕获这些跟踪参数,创建cookie,然后使用301重定向将URL重定向到规范版本。然而,对于额外的10%增益而言,这可能是一项令人望而却步的工作量,因此很多人更愿意从规范标签开始。
关于您的第二个问题,如果有人链接到Google,您通常不希望从Google中删除这些网址。通过使用规范标记,您可以实现相同的目标,但不会丢失任何到您网站的入站链接值。
有关规范标记的更多信息,以及具体问题&amp;解决方案,看看我在这里写的这篇文章:http://janeandrobot.com/library/url-referrer-tracking。
答案 1 :(得分:1)
Google网站管理员工具会告诉您重复的标题以及Google看到的“重复”引起的其他问题,这些问题实际上是使用两个不同的网址版本提供的同一页面。我建议您尝试确保重复标题下网站站长工具帐户中列出的错误数量尽可能接近零。