scipy.stats.ks_2samp函数有两个版本。 scipy.stats.ks_2samp是标准版本,scipy.stats.mstats.ks_2samp是丢弃"丢失值的版本"。鉴于缺少 no entires 的分布,结果是不同的。为什么?代码:
import numpy as np
from scipy.stats import ks_2samp
from scipy.stats.mstats import ks_2samp as ks_2sampm
a = np.array([1, 3, 6, 8, 8])
b = np.array([2, 3, 4, 6])
ks_2samp(a, b)# statistic=0.40000000000000002, pvalue=0.75428850089034016
ks_2sampm(a, b) #(statistic=0.39999999999999997, pvalue=0.86916357240334474)
为什么不同的p值?我使用的是scipy v1.0.0