我们正在针对特定搜索字词记录极高数量的搜索: - “biscru”或“Ticru”(过去2个月内为63,000次)。 apache日志显示这些请求来自Googles服务器,但我发现很难相信并怀疑IP地址是欺骗性的。
Apache日志示例: -
rawliving.eu:66.249.72.227 - - [06/Jul/2013:01:25:09 +0100]
"GET /catalogsearch/result/index/?cat=47&dir=desc&limit=25&mode=list&order=event_date&p=6
&q=%22biscru%22+OR+%22Ticru%22
HTTP/1.1" 200 20587 "-" "Mozilla/5.0 (compatible; Googlebot/2.1;
+http://www.google.com/bot.html)"
显然阻止66.249.72.227不是一个选项,因为它是一个有效的谷歌地址所以任何人都可以建议我们有什么选择来防止这种失真,并可能确定这些请求的来源和原因?
感激地收到任何建议。 利
答案 0 :(得分:3)
将此添加到layout-xml定义,例如那个local.xml
<catalogsearch_result_index translate="label">
<reference name="head">
<action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
</reference>
</catalogsearch_result_index>
<catalogsearch_advanced_index translate="label">
<reference name="head">
<action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
</reference>
</catalogsearch_advanced_index>
<catalogsearch_advanced_result translate="label">
<reference name="head">
<action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
</reference>
</catalogsearch_advanced_result>
几天后检查问题是否仍然存在...或者只是使用robots.txt文件来阻止编目网址被编入索引。