Question

我想估计一组数据的平均值。

我有1000个数据点，我在某处读到，如果你的样本量小于30，你应该使用t分数，否则使用z分数。

这是我使用的代码

def mean_confidence_interval(data,confidence = 0.95):

    from numpy import mean,array
    import scipy as sp
    import scipy.stats

    a = array(data)

    n = len(a)
    m, se = mean(a), scipy.stats.sem(a)
    h = se*sp.stats.t._ppf( (1+confidence)/2., n-1)

    return m, h, (m-h,m+h)

我想知道哪个函数我可以使用sp.stats.t._ppf的insteaf来计算正确的z分数。

Answer 1

当已知总体标准偏差时，您使用 z -score / test，而当根据数据估算时，使用 t -score / test。对于大样本（〜> 30），它们变成相同的东西。所以在你的情况下，我只会使用你的 t - 得分置信区间。

我的置信区间是否使用z分数或t分数？

1 个答案: