我有一组看起来像这样的数据:
data = [1,1,2,3,3,5,5]
point = 6
我不知道这些数据是否正常或其他任何有关其分布的信息。我想有信心地计算point
明显高于data
。
我试过了:
import math
from scipy.stats import t
import numpy as np
confidence = (
t.interval(0.95,len(data)-1,loc=np.mean(data),
scale=np.std(data)/math.sqrt(len(data))))
这会返回一个下限和上限,但通常在处理我的实际数据时,我使用的point
似乎显着提升,但远低于data
中包含的许多数字。我使用最好的测试还是有更好的东西?
答案 0 :(得分:1)
可以在维基百科上找到置信区间的公式。假设您知道公式,并假设数据正常,您可以执行类似......
的操作import numpy as np
data = np.array([1,1,2,3,3,5,5])
z_alpha = 1.96 #Change for appropriate alpha level. I use standard normal, but you could use t-dist
n = data.size
m = data.mean()
s = data.std()
interval = m + z_alpha*s/np.sqrt(n)*np.array([-1,1])
# Point in interval?
point = 6
(point<=interval[1])&(point>=interval[0])