我已经在python上调用了KS-test函数来比较两个特性:大小和持续时间,我在解释输出时有点迷失。这是我的代码:
from scipy.stats import ks_2samp
import csv
ds1=getColumn("TraceBG.csv",5)
ds2=getColumn("TraceFG.csv",5)
ds11=getColumn("TraceBG.csv",6)
ds12=getColumn("TraceFG.csv",6)
print "size: | ",ks_2samp(ds1,ds2)
print "duration: | ",ks_2samp(ds11,ds12)
我将此作为输出:
尺寸:| (0.25583333333333336,0.0039023335557401583)
持续时间:| (0.11504409325067666,0.092596990959821421)
我从KS测试的scipy网页上知道第一个是统计值,第二个是p值。但是如何从这个值中确切地解释哪个特征更好?
答案 0 :(得分:0)
KS检验与零假设相关:被比较的群体是从同一群体中抽样的。
如果零假设为真,则p值是观察采样组之间特定偏差的概率。
对于尺寸,观察到的偏差水平预计为0.3%的样品运行。
持续时间内,偏差程度为9%。
哪个功能更好?如果任务是试图区分一个人口群体,那么规模可能会更好。