Pearson相关系数双尾p值意义

时间:2012-11-30 22:13:23

标签: python math numpy statistics scipy

来自我使用的sciPy库:scipy.stats.stats导入pearsonr来计算两个数组的相关系数,得到的值为:(0.80751532276005755,0.19248467723994242)。

我认为我会在-1到+1的范围内得到一个值,所以我不确定如何解释这两个结果。这是我的两个阵列:

x = [50,500,1500,2500]
y = [17, 6, 6, 194]

我做了:

pearsonr(x,y)

由于

1 个答案:

答案 0 :(得分:22)

pearsonr()返回一个由相关系数和相应的p值组成的二元组:

  • 相关系数的范围为-1到+1。
  • 零假设是两个变量不相关。 p值是0到1之间的数字,表示如果零假设为真,您的数据将出现的概率。

有关进一步的讨论,请参阅http://www.eecs.qmul.ac.uk/~norman/blog_articles/p_values.pdf

  

我以为我会在-1到+1

的范围内得到一个值

如果您只需要相关系数,只需忽略元组的第二个元素(p值):

corrxy = pearsonr(x,y)[0]

值得一提的是,还有numpy.corrcoef(),它计算相关矩阵(没有p值)。