我的置信区间是否使用z分数或t分数?

时间:2015-07-05 21:40:28

标签: python statistics scipy

我想估计一组数据的平均值。

我有1000个数据点,我在某处读到,如果你的样本量小于30,你应该使用t分数,否则使用z分数。

这是我使用的代码

def mean_confidence_interval(data,confidence = 0.95):

    from numpy import mean,array
    import scipy as sp
    import scipy.stats

    a = array(data)

    n = len(a)
    m, se = mean(a), scipy.stats.sem(a)
    h = se*sp.stats.t._ppf( (1+confidence)/2., n-1)

    return m, h, (m-h,m+h)

我想知道哪个函数我可以使用sp.stats.t._ppf的insteaf来计算正确的z分数。

1 个答案:

答案 0 :(得分:1)

当已知总体标准偏差时,您使用 z -score / test,而当根据数据估算时,使用 t -score / test。对于大样本(〜> 30),它们变成相同的东西。所以在你的情况下,我只会使用你的 t - 得分置信区间。