我想估计一组数据的平均值。
我有1000个数据点,我在某处读到,如果你的样本量小于30,你应该使用t分数,否则使用z分数。
这是我使用的代码
def mean_confidence_interval(data,confidence = 0.95):
from numpy import mean,array
import scipy as sp
import scipy.stats
a = array(data)
n = len(a)
m, se = mean(a), scipy.stats.sem(a)
h = se*sp.stats.t._ppf( (1+confidence)/2., n-1)
return m, h, (m-h,m+h)
我想知道哪个函数我可以使用sp.stats.t._ppf
的insteaf来计算正确的z分数。
答案 0 :(得分:1)
当已知总体标准偏差时,您使用 z -score / test,而当根据数据估算时,使用 t -score / test。对于大样本(〜> 30),它们变成相同的东西。所以在你的情况下,我只会使用你的 t - 得分置信区间。