我有一系列Facebook页面,我每天都会记录“喜欢”的数量。
我想确定那些增长最快的那些。问题是,我想知道如何删除少数喜欢和喜欢的页面的“噪音”。
我在这里尝试做的是否有任何一般技巧或方法?
答案 0 :(得分:1)
或多或少的统计上正确(和简单)答案是:
假设第一次测量是x次,第二次是喜欢,
然后估算生长的自然对数
log(y / x),误差估计为sqrt(1 / x + 1 / y)
但是既然你对增长的保守估计感兴趣,你应该使用约5%的置信区间。 因此,我建议使用以下功能对数据集进行排名。 log(y / x) - 2 * sqrt(1 / x + 1 / y)
例如:
从1增加到10将得分为0.2
从100增加到400将得到1.16
的分数从10000增加到15000将得到0.38
的分数该估算器的一个重要特性是增长 从10000到100000将排名高于从1000增加到10000,反过来将排名高于从100增长到1000等...
答案 1 :(得分:0)
一种可能性是为增长创建综合指标,同时考虑百分比和绝对数字。
我建议在第1天以#10的对数为基数,并将其与增长百分比相乘,以达到这个“增长等级”,我会称之为。
如果您认为“最终衡量标准”提供了增长的最大数字,您认为这些数字对于增长而言意义重大且数量较少,则您认为这些数字并不重要。
答案 2 :(得分:0)
您需要对增长百分比应用某种加权,我建议使用log(B / 10),因此您要排名的指标是:
score = log(B/10) * C
您可以在那里尝试常数术语以及日志库。谷歌,例如谷歌,这是一个很好的工具。将其输入谷歌搜索以查看加权函数的图:
y = log(x/10)
或者拿一份gnuplot。