我正在尝试遍历数据框并计算x,y每次观察的相关性并存储这是一个新的框架。
sub_dat文件包含日期,硫酸盐,硝酸盐,ID
的列for (s in sub_dat$ID) {
corrData <- rbind(cor(sub_dat$sulfate, sub_dat$nitrate))
}
corrData
我所得到的只是单个值而不是矩阵。我已经删除了NA,我在调试时没有收到任何错误。有什么想法吗?
答案 0 :(得分:1)
我不太确定你的数据是什么样的,但我会假设这样的事情:
x y group
1 0.08474419 0.16459807 1
2 -0.52390488 -0.52922622 1
3 0.12789339 -0.37239925 1
4 -0.49442433 -0.51763038 1
5 0.22440165 -0.73524373 1
6 -0.13219889 0.06979758 2
7 2.60532503 1.15088422 2
8 0.49880770 0.73113421 2
9 0.05612694 0.44701820 2
10 0.29456281 0.76804105 2
使用library(dplyr)
,您可以执行df %>% group_by(group) %>% summarise(corr = cor(x, y))
输出:
group corr
1 1 0.2093626
2 2 0.8392375