在scipy.stats.spearmanr中使用什么类型的重要性测试来产生它吐出的p值?文档只是说它是一个双面的p值,但关于什么分布?这是一个t分布吗?
答案 0 :(得分:4)
p值粗略地表示不相关系统产生具有Spearman相关性的数据集的概率至少与从这些数据集计算的数据集一样极端。 p值并不完全可靠,但对于大于500左右的数据集可能是合理的。
当您查看source code时,您会发现他们计算了一个t值:
% rs is rho
t = rs * np.sqrt((n-2) / ((rs+1.0)*(1.0-rs)))
然后计算p值,假设具有两个自由度的t分布:
prob = distributions.t.sf(np.abs(t),n-2)*2
这也在Wikipedia上作为计算统计显着性的一个选项进行了解释。