2样本KS测试 - 似乎有些不对劲

时间:2016-07-15 20:13:07

标签: python scipy statistics kolmogorov-smirnov

我正在尝试使用scipy中的ks_2samp函数运行Kolmogorov-Smirnoff测试,以确定数据的直方图是否来自同一分布。尽管有时返回的p值似乎不太正确......

例如,使用此直方图:

Histogram.jpg

aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5)

dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1)

print ks_2samp(aa, dd)`[1]`

我得到一个大约.96的p值,这看起来真的不对......我做错了什么?这些直方图不应该足够不同,p值会更低吗?

1 个答案:

答案 0 :(得分:3)

ks_2samp将Kolmogorov-Smirnov检验应用于两个样本,并检验两个来自相同分布的零假设。

因此,ks_2samp也会将两个样本(此处为list1list2)作为输入。

ks_2samp(list1, list2)