计算分布的置信水平

时间:2018-05-22 20:08:57

标签: python scipy statistics

我有一组看起来像这样的数据:

data = [1,1,2,3,3,5,5]
point = 6

我不知道这些数据是否正常或其他任何有关其分布的信息。我想有信心地计算point明显高于data

我试过了:

import math
from scipy.stats import t
import numpy as np
confidence = (
    t.interval(0.95,len(data)-1,loc=np.mean(data),
    scale=np.std(data)/math.sqrt(len(data))))

这会返回一个下限和上限,但通常在处理我的实际数据时,我使用的point似乎显着提升,但远低于data中包含的许多数字。我使用最好的测试还是有更好的东西?

1 个答案:

答案 0 :(得分:1)

可以在维基百科上找到置信区间的公式。假设您知道公式,并假设数据正常,您可以执行类似......

的操作
import numpy as np

data = np.array([1,1,2,3,3,5,5])
z_alpha = 1.96 #Change for appropriate alpha level.  I use standard normal, but you could use t-dist
n = data.size
m = data.mean()
s = data.std()
interval = m + z_alpha*s/np.sqrt(n)*np.array([-1,1])

# Point in interval?

point = 6

(point<=interval[1])&(point>=interval[0])