两组中矢量之间的相关性(定义为:group_by)

时间:2017-04-24 11:07:58

标签: r group-by dplyr

我想在两个不同的组(由group_by定义)中的两个向量之间建立关联。解决方案需要基于dplyr。

我的数据采用所谓的CDISC格式。为简单起见:这里有一些虚拟数据。(注意一列(“值”)包含所有数据)

n=5
bmi<-rnorm(n=n,mean=25)
glucose<-rnorm(n=n,mean=5)
insulin<-rnorm(n=n,mean=10)
id<-rep(paste0("id",1:n),3)
myData<-data.frame(id=id,measurement=c(rep("BMI",n),rep("glucose",n),rep("insulin",n)),values=c(bmi,glucose,insulin))    

请记住,处理此类数据的所有函数都是使用dplyr包,例如:

myData %>% group_by(measurement) %>% summarise(mean(values), n())

我的问题是,如何获得葡萄糖和胰岛素(cor(葡萄糖,胰岛素))之间的相关性?或者以更一般的方式:我如何获得两组之间的相关性。

以下解决方案显然是非常错误的(但可能有助于理解我的问题):

myData %>% group_by(measurement) %>% summarise(cor(glucose,insulin))

我希望你能帮助我,我可能会忽略一些基本的dplyr。

非常感谢先进的

托马斯

0 个答案:

没有答案