Google如何统计和估算搜索结果的数量?例如,当我搜索“stackoverflow”时,它会计算2,910,000个结果。
答案 0 :(得分:1)
可能是最具权威性的文章:
http://searchengineland.com/why-google-cant-count-results-properly-53559
因为有趣的是注意到取出东西实际上有时会产生更多的结果(!!)。
来自Google开发人员(网络垃圾邮件团队负责人Matt Cutts):
“我们试图非常清楚我们的结果估计只是 - 估计。理论上我们可以在我们系统的这个方面花费周期,但在实践中我们还有很多其他的工作要做,以及更多准确的结果估计值在列表中低于许多其他东西“
答案 1 :(得分:1)
我认为这个问题是技术问题而不是概念问题。
那就是MEMCACHE。
据我所知,memcache
,在标准时间内进行任何操作。 记录数量无关紧要。 distributed RAM
架构。对于类似的实时实现,请阅读Sharding Counters article。它们保持包含大约10-1000 2-4 gb RAM的簇,它们在它们中进行临时数学运算,当它们保持最终值时,它们只总结每个RAM中的总和。
我对该实现的使用告诉它会更快(也更准确)。 它现在是开源的,请访问memcached。
提到公司“估计”价值...... 我的观点是大公司(包括谷歌)将人们从真相中转移出去。人们倾向于使用他们所提供的东西,并且不会在不久的将来成为公司的竞争对手。人们意味着公司,投资者,人才潜力技术人员,每个人。< / p>
如果他们估计,他们做了很多事情是“估计”无法做到的。像钱包api,adsense发票等等。