依赖变量和自变量之间的相关性

时间:2015-10-05 21:55:32

标签: r correlation

我有一个带有一个因变量和20个独立变量的数据框。我想找到因变量和每个自变量之间的相关系数以及相关的p值。我写了以下函数:

for (i in 2:20){
     correl = cor.test(df[ , i], df[ , 22])
     print(correl)
}

一次打印出一个相关系数及其p值。是否有一个以表格格式产生相同结果的函数?

1 个答案:

答案 0 :(得分:1)

您可以使用sapply获取结果向量,每对一个结果:

base.idx <- 1
other.idx <- 2:20
cors <- unname(sapply(other.idx, function(i) cor.test(df[,base.idx], df[,i])$estimate))
pvals <- unname(sapply(other.idx, function(i) cor.test(df[,base.idx], df[,i])$p.value))

这是一个内置虹膜数据集的示例,抓取Sepal.Length和其他三个数值之间的相关信息:

base.idx <- 1
other.idx <- 2:4
(cors <- unname(sapply(other.idx, function(i) cor.test(iris[,base.idx], iris[,i])$estimate)))
# [1] -0.1175698  0.8717538  0.8179411
(pvals <- unname(sapply(other.idx, function(i) cor.test(iris[,base.idx], iris[,i])$p.value)))
# [1] 0.1518983 0.0000000 0.0000000