我有一个堆栈系统,可以在URL中传递页面令牌。我的页面也是动态创建的内容,所以我有一个php页面来访问带参数的内容。
index.php?grade=7&page=astronomy&pageno=2&token=foo1
我理解搜索索引的目标是:您的网站上每个唯一数据集只有一个链接。
Bing有办法指定具体的parameters to ignore。
谷歌似乎使用rel="canonical"
但是可以用它来告诉谷歌忽略令牌参数吗?我的网址(没有令牌)可以是:
index.php?grade=5&page=astronomy&pageno=2
index.php?grade=6&page=math&pageno=1
index.php?grade=7&page=chemistry&page2=combustion&pageno=4
如果Google没有解决方案......其他可能的解决方案:
如果我为每个基页提供站点地图,我可以提供基本URL,但该页面链接的任何内容都会在结果页面上创建令牌。另外,我必须不断重新创建站点地图以覆盖新页面(例如,每页25个帖子,第26页的帖子位于第2页)。
我有一个想法是识别页面加载时的机器人(我已经这样做了)并禁用机器人的所有令牌。由于(我假设)机器人无论如何都不使用页面之间的会话数据,后退按钮和编辑功能是无用的。为机器人编写自定义代码是否可行(或者它是否疯狂)?
感谢您的想法。