Question

我已经在python上调用了KS-test函数来比较两个特性：大小和持续时间，我在解释输出时有点迷失。这是我的代码：

from scipy.stats import ks_2samp
import csv

ds1=getColumn("TraceBG.csv",5)
ds2=getColumn("TraceFG.csv",5)
ds11=getColumn("TraceBG.csv",6)
ds12=getColumn("TraceFG.csv",6)

print "size: | ",ks_2samp(ds1,ds2)
print "duration: | ",ks_2samp(ds11,ds12)

我将此作为输出：

尺寸：| （0.25583333333333336,0.0039023335557401583）

持续时间：| （0.11504409325067666,0.092596990959821421）

我从KS测试的scipy网页上知道第一个是统计值，第二个是p值。但是如何从这个值中确切地解释哪个特征更好？

Answer 1

KS检验与零假设相关：被比较的群体是从同一群体中抽样的。

如果零假设为真，则p值是观察采样组之间特定偏差的概率。

对于尺寸，观察到的偏差水平预计为0.3％的样品运行。

持续时间内，偏差程度为9％。

哪个功能更好？如果任务是试图区分一个人口群体，那么规模可能会更好。

Kolmogorov-Smirnov检验的Scipy输出

1 个答案: