确定显着增长

时间:2012-11-30 11:56:14

标签: php statistics

我有一系列Facebook页面,我每天都会记录“喜欢”的数量。

我想确定那些增长最快的那些。问题是,我想知道如何删除少数喜欢和喜欢的页面的“噪音”。

facebook likes chart

我在这里尝试做的是否有任何一般技巧或方法?

3 个答案:

答案 0 :(得分:1)

或多或少的统计上正确(和简单)答案是:

假设第一次测量是x次,第二次是喜欢,

然后估算生长的自然对数

log(y / x),误差估计为sqrt(1 / x + 1 / y)

但是既然你对增长的保守估计感兴趣,你应该使用约5%的置信区间。 因此,我建议使用以下功能对数据集进行排名。 log(y / x) - 2 * sqrt(1 / x + 1 / y)

例如:

从1增加到10将得分为0.2

从100增加到400将得到1.16

的分数

从10000增加到15000将得到0.38

的分数

该估算器的一个重要特性是增长 从10000到100000将排名高于从1000增加到10000,反过来将排名高于从100增长到1000等...

答案 1 :(得分:0)

一种可能性是为增长创建综合指标,同时考虑百分比和绝对数字。

我建议在第1天以#10的对数为基数,并将其与增长百分比相乘,以达到这个“增长等级”,我会称之为。

enter image description here

如果您认为“最终衡量标准”提供了增长的最大数字,您认为这些数字对于增长而言意义重大且数量较少,则您认为这些数字并不重要。

答案 2 :(得分:0)

您需要对增长百分比应用某种加权,我建议使用log(B / 10),因此您要排名的指标是:

score = log(B/10) * C

您可以在那里尝试常数术语以及日志库。谷歌,例如谷歌,这是一个很好的工具。将其输入谷歌搜索以查看加权函数的图:

y = log(x/10) 

或者拿一份gnuplot。