选择R中的特定元素为cor()

时间:2016-09-25 15:06:24

标签: r parameters correlation

我需要找到两个变量cor(dataframe$x,dataframe$y)之间的相关性,其中x, y是列名,dataframe是数据帧。我的数据框中的一列是指标函数(0和1)。

我想知道如何比较两个独立组(0和1)的x值及其对应的y值。我是R的新手,所以我想我想知道cor()函数中是否有内置功能,或者我是否需要使用x'sy's重建数据框/数组找到不同组的相关性。

猜猜这也引出了另一个问题(我已经用Google搜索了,对我来说还不是很清楚):在这些函数中使用R中的向量,数组和数据帧之间有什么区别(即cor()t.test()等)?

1 个答案:

答案 0 :(得分:1)

您可以计算指标列指定的行子集的相关性。要选择子集,请使用dataframe[logical_index,],其中logical_index是布尔值的向量(在R中称为逻辑)。为此,您应将指标转换为布尔值。

logical_index <- as.logical(dataframe$indicator)
cor(dataframe[logical_index,]$x, dataframe[logical_index,]$y)
cor(dataframe[!logical_index,]$x, dataframe[!logical_index,]$y)

向量,矩阵,数组,列表和数据框都是R的不同原始类型.Hadley在高级R中给出了明确且相对简单的差异介绍:http://adv-r.had.co.nz/Data-structures.html