我需要找到两个变量cor(dataframe$x,dataframe$y)
之间的相关性,其中x, y
是列名,dataframe
是数据帧。我的数据框中的一列是指标函数(0和1)。
我想知道如何比较两个独立组(0和1)的x值及其对应的y值。我是R的新手,所以我想我想知道cor()
函数中是否有内置功能,或者我是否需要使用x's
和y's
重建数据框/数组找到不同组的相关性。
猜猜这也引出了另一个问题(我已经用Google搜索了,对我来说还不是很清楚):在这些函数中使用R中的向量,数组和数据帧之间有什么区别(即cor()
,t.test()
等)?
答案 0 :(得分:1)
您可以计算指标列指定的行子集的相关性。要选择子集,请使用dataframe[logical_index,]
,其中logical_index
是布尔值的向量(在R中称为逻辑)。为此,您应将指标转换为布尔值。
logical_index <- as.logical(dataframe$indicator)
cor(dataframe[logical_index,]$x, dataframe[logical_index,]$y)
cor(dataframe[!logical_index,]$x, dataframe[!logical_index,]$y)
向量,矩阵,数组,列表和数据框都是R的不同原始类型.Hadley在高级R中给出了明确且相对简单的差异介绍:http://adv-r.had.co.nz/Data-structures.html