相关失败 - 皮尔逊

时间:2011-08-26 05:24:34

标签: r correlation data-processing

我想写关于相关性的数据文件信息,如下所示:

*korelacja=cor(p2,d2,method="pearson",use = "complete.obs")
korelacja2=cor(p2,d2,method="kendall",use = "complete.obs")
korelacja3=cor(p2,d2,method="spearman",use = "complete.obs")
dane=paste(korelacja,korelacja2,korelacja3,sep=';')
write(dane,file=nazwa,append=TRUE)*

结果对我来说很奇怪 - Pearson相关性非常高(总是相等),但Kendall和Spearman非常低。我创建散点图,我没有看到线性相关。

1 个答案:

答案 0 :(得分:1)

如果您的数据中存在一些支配Pearson相关性但在非参数(Kendall / Spearman)方法中相对无关紧要的异常值,则复制此模式并不难。例如,这里是一个编制的数据集,除了一个大的异常值外没有任何内容:

> set.seed(1001)
> x <- c(runif(1000),1e5)
> y <- c(runif(1000),1e5)
> cor(x,y,method="pearson")
[1] 1
> cor(x,y,method="kendall")
[1] -0.02216583
> cor(x,y,method="spearman")
[1] -0.03335352

这与您到目前为止的描述一致,尽管在这种情况下您应该能够在散点图中看到异常值...