我似乎无法找到有关Google如何确定您{0}}内容的任何信息。从技术角度来看,您认为他们是如何决定这一点的?他们是否发送googlebot以外的东西并将其与googlebot结果进行比较?他们是否有一个人类队伍比较?或者他们可以以某种方式告诉您已经检查了用户代理并执行了不同的代码路径,因为您在名称中看到了“googlebot”?
这与cloaking上的这个问题有关。如果文本内容完全相同,但渲染不同(1995风格的html与ajax与flash相比),真的有隐藏真的问题吗?
感谢你加入这个。
答案 0 :(得分:4)
据我所知,Google如何准备搜索引擎结果是秘密的,并且不断变化。欺骗不同的用户代理很容易,所以他们可能会这样做。在Javascript的情况下,它们也可能实际呈现部分或整个页面。 “他们有一群人在比较吗?”这是值得怀疑的。关于Google的抓取策略(包括this)已经写了很多,但如果涉及人类,他们只会针对特定情况进行调用。我甚至怀疑这一点:任何人耗电都可能是通过调整爬行引擎来度过的。
答案 1 :(得分:2)
Google会在展示除googlebot之外的用户代理时查看您的网站。
答案 2 :(得分:2)
请参阅其描述的Google Chrome comic book page 11(甚至比外行人的条款更好),了解Google工具如何制作网页示意图。他们可能正在使用这种或类似的技术进行谷歌搜索索引和斗篷检测 - 至少这将是它的另一个好用途。
答案 3 :(得分:2)
实际上,谷歌的许多算法都被轻易逆转,远非火箭科学。在所谓的“伪装检测”的情况下,所有先前的猜测都在钱上(除了,有点讽刺的是,John K lol)如果你不相信我设置了一些测试站点(输入)和一些'隐藏测试用例(进一步输入),将您的网站提交给谷歌叔叔(处理),并通过伪高级人类认知相关量子感知测试您的非假设(< - 顺便说一句,我提出了娱乐价值(现在我正在筑巢括号,真的弄乱你的想法:))AKA“检查谷歌调查,看看你是否被禁止”(输出)。循环直到enlightenment == True(noob!)lol
答案 4 :(得分:2)
Google确实雇佣承包商(间接地,通过外部机构,以非常低的工资)手动审核作为搜索结果返回的文件,并判断其与搜索条件,翻译质量等的相关性。我非常怀疑这是他们的只有用于检测伪装的工具,但它是其中之一。
答案 5 :(得分:1)
一个非常简单的测试是比较Googlbot看到的网页的文件大小与看起来像普通用户的Google别名用户扫描的网页的文件大小。
这将检测大多数可疑候选人进行更仔细的检查。
答案 6 :(得分:1)
他们使用像curl这样的工具调用你的页面,他们根据没有用户代理的页面构建一个哈希,然后他们用googlebot用户代理构建另一个哈希。两个哈希都必须是类似的,它们有算法来检查哈希并知道它是否有隐形