从选择中检索前50个值的最佳方法

时间:2019-03-07 06:05:44

标签: database performance search server

问题。

假设您在搜索引擎公司工作,并且希望看到昨天搜索量最高的前50名关键字。如果访问日志分布在数千台服务器上,那么实现目标的最佳方法是什么?

1)Redis在这种情况下表现出色。创建一个程序,通过搜索关键字检查搜索到的计数,让它读取所有分布式日志,然后使用Redis命令找到前50个。

2)在这种情况下,RDS是最好的。创建一个程序,通过搜索关键字检查搜索到的计数,并通过SQL命令找到前50名。

3)搜索引擎(ElsaticSearch,Solr)具有内部过程,可以保存每个关键字的搜索计数。使用该索引即可。

4)在这种情况下,MapReduce是最好的。通过MapReduce分发过程并汇总结果将是这种方式。

-结束-

我对开发人员世界比较陌生。这是我申请的公司的调查表,这让我感到困惑,那是最好的。申请过程已经完成,所以我没有利用它,只是想知道什么是最好的方法,我应该研究哪个领域来轻松找出此类问题的答案。希望这对您也是一个积极的挑战。

谢谢。

0 个答案:

没有答案