为什么SciPy返回`nan`进行t检验,样本为0方差?

时间:2016-07-13 15:44:27

标签: python scipy nan hypothesis-test

我在Python中使用SciPy,以下因任何原因返回nan值:

>>>stats.ttest_ind([1, 1], [1, 1])
Ttest_indResult(statistic=nan, pvalue=nan)

>>>stats.ttest_ind([1, 1], [1, 1, 1])
Ttest_indResult(statistic=nan, pvalue=nan).

但每当我使用具有不同汇总统计数据的样本时,我实际上得到了一个合理的值:

stats.ttest_ind([1, 1], [1, 1, 1, 2])
Ttest_indResult(statistic=-0.66666666666666663, pvalue=0.54146973927558495).

nan的p值解释为0是否合理?统计数据是否有理由对具有相同汇总统计数据的样本进行双样本t检验是否有意义?

1 个答案:

答案 0 :(得分:3)

除以零将引发NaN(=非数字)异常,或返回按常规匹配NaN的浮点表示。要特别注意除以N除以N除-1标准差公式。