我想计算V2与V3,V4,...,V18的相关性: 那是cor(V2,V3,na.rm = TRUE),cor(V2,V4,na.rm = TRUE)等 最有效的方法是什么?
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18
1 141_21311223 2.000 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
2 44_33331123 2.000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
3 247_11131211 2.065 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
4 33_31122113 2.080 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
5 277_21212111 2.090 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0
答案 0 :(得分:2)
将我的评论转换为答案,一种简单的方法是在sapply
语句中使用列位置:
sapply(3:ncol(mydf), function(y) cor(mydf[, 2], mydf[, y], ))
这应该创建输出值的向量。如果您希望sapply
作为输出,请将lapply
更改为list
。
我从未见过na.rm
cor
但是......