我有一个相对简单的算法问题,我向用户推荐问题
目前的实施:
(total comments + likes for all answers for a question) / sqrt (number of answers)
问题:
不胜感激任何有关这两个问题的建议都可以否定。
答案 0 :(得分:0)
通常当我们想避免让一个样本过于强大时,标准的方法就是通过以下方法之一:
log(N)
代替N
,使每项观察的效果不那么强大 1 对于第二个问题 - 我能想到的一件事就是给出一个变量因素:改为使用sqrt(number of answers)
- 您可以尝试(number_of_answers)^(log(number_of_answers+1)/log(max_answers+1))
其中max_answers
是每个问题的最大答案数在您的数据集中。
这将导致提出问题的答案很少,我认为这就是你所追求的目标。
(1):我们通常会log(N+1)
- 因此也会为N==0
定义。