Question

我想在两个不同的组（由group_by定义）中的两个向量之间建立关联。解决方案需要基于dplyr。

我的数据采用所谓的CDISC格式。为简单起见：这里有一些虚拟数据。（注意一列（“值”）包含所有数据）

n=5
bmi<-rnorm(n=n,mean=25)
glucose<-rnorm(n=n,mean=5)
insulin<-rnorm(n=n,mean=10)
id<-rep(paste0("id",1:n),3)
myData<-data.frame(id=id,measurement=c(rep("BMI",n),rep("glucose",n),rep("insulin",n)),values=c(bmi,glucose,insulin))

请记住，处理此类数据的所有函数都是使用dplyr包，例如：

myData %>% group_by(measurement) %>% summarise(mean(values), n())

我的问题是，如何获得葡萄糖和胰岛素（cor（葡萄糖，胰岛素））之间的相关性？或者以更一般的方式：我如何获得两组之间的相关性。

以下解决方案显然是非常错误的（但可能有助于理解我的问题）：

myData %>% group_by(measurement) %>% summarise(cor(glucose,insulin))

我希望你能帮助我，我可能会忽略一些基本的dplyr。

非常感谢先进的

托马斯

两组中矢量之间的相关性（定义为：group_by）

0 个答案: