我正在尝试使用scipy中的ks_2samp函数运行Kolmogorov-Smirnoff测试,以确定数据的直方图是否来自同一分布。尽管有时返回的p值似乎不太正确......
例如,使用此直方图:
aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5)
dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1)
print ks_2samp(aa, dd)`[1]`
我得到一个大约.96的p值,这看起来真的不对......我做错了什么?这些直方图不应该足够不同,p值会更低吗?
答案 0 :(得分:3)
ks_2samp
将Kolmogorov-Smirnov检验应用于两个样本,并检验两个来自相同分布的零假设。
因此,ks_2samp
也会将两个样本(此处为list1
和list2
)作为输入。
ks_2samp(list1, list2)