Kolmogorov-Smirnov检验的Scipy输出

时间:2014-08-11 15:50:04

标签: python numpy

我已经在python上调用了KS-test函数来比较两个特性:大小和持续时间,我在解释输出时有点迷失。这是我的代码:

from scipy.stats import ks_2samp
import csv

ds1=getColumn("TraceBG.csv",5)
ds2=getColumn("TraceFG.csv",5)
ds11=getColumn("TraceBG.csv",6)
ds12=getColumn("TraceFG.csv",6)

print "size: | ",ks_2samp(ds1,ds2)
print "duration: | ",ks_2samp(ds11,ds12)

我将此作为输出:

  

尺寸:| (0.25583333333333336,0.0039023335557401583)

     

持续时间:| (0.11504409325067666,0.092596990959821421)

我从KS测试的scipy网页上知道第一个是统计值,第二个是p值。但是如何从这个值中确切地解释哪个特征更好?

1 个答案:

答案 0 :(得分:0)

KS检验与零假设相关:被比较的群体是从同一群体中抽样的。

如果零假设为真,则p值是观察采样组之间特定偏差的概率。

对于尺寸,观察到的偏差水平预计为0.3%的样品运行。

持续时间内,偏差程度为9%。

哪个功能更好?如果任务是试图区分一个人口群体,那么规模可能会更好。