我想在两个不同的组(由group_by定义)中的两个向量之间建立关联。解决方案需要基于dplyr。
我的数据采用所谓的CDISC格式。为简单起见:这里有一些虚拟数据。(注意一列(“值”)包含所有数据)
n=5
bmi<-rnorm(n=n,mean=25)
glucose<-rnorm(n=n,mean=5)
insulin<-rnorm(n=n,mean=10)
id<-rep(paste0("id",1:n),3)
myData<-data.frame(id=id,measurement=c(rep("BMI",n),rep("glucose",n),rep("insulin",n)),values=c(bmi,glucose,insulin))
请记住,处理此类数据的所有函数都是使用dplyr包,例如:
myData %>% group_by(measurement) %>% summarise(mean(values), n())
我的问题是,如何获得葡萄糖和胰岛素(cor(葡萄糖,胰岛素))之间的相关性?或者以更一般的方式:我如何获得两组之间的相关性。
以下解决方案显然是非常错误的(但可能有助于理解我的问题):
myData %>% group_by(measurement) %>% summarise(cor(glucose,insulin))
我希望你能帮助我,我可能会忽略一些基本的dplyr。
非常感谢先进的
托马斯