如何在平滑“规范”之外的任何点的同时计算一组数据的平均值。已经有一段时间了,因为我必须做任何真正的数学,但我确信我在某处学到了...
假设我有一个项目的12天销售数据:2,2,2,50,10,15,9,6,2,0,2,1
我想计算每天的平均销售额而不允许第4天(50)将平均值搞得太多。 Log,Percentile,我想的那样......
答案 0 :(得分:5)
听起来你正在寻找moving average。
答案 1 :(得分:1)
您还可以通过标准偏差的某个倍数进行阈值处理来进行过滤。这将过滤出比平均值(平均值)远远超出预期的结果。
标准差只是sqrt(sum(your_values - average_value)/ number_of_values)。
编辑:您还可以通过它与平均值的偏差来查看对值的加权。因此,非常大的值可以加权为1 / exp(偏差),因此距离它们的平均值的距离要小得多。
答案 2 :(得分:1)
你会想要使用像IQR(interquartile range)这样的东西。基本上你将数据分成四分位数,然后计算第一和第三四分位数的中位数。然后,您可以获得数据的集中趋势。