R:过滤数据并计算相关性

时间:2016-03-20 04:46:46

标签: r

所以我现在正在学习R,并且一直在寻找'where'函数(就像SQL中的那个)。

我在下面尝试做的是计算每个月的温度和湿度之间的相关性(用csv表示为1,2,3 ......)

我在下面使用的代码必须在从'main'数据集中过滤冗余数据后创建新数据集,然后分别计算每个数据集的相关性。

airquality <- read.csv("C:/Users/Spitz/Documents/airquality.csv")

january <- airquality [!airquality$Month %in% c(2,3,4,5),]
february <- airquality [!airquality$Month %in% c(1,3,4,5),]
march <- airquality [!airquality$Month %in% c(1,2,4,5),]
april <- airquality [!airquality$Month %in% c(1,2,3,5),]
may <- airquality [!airquality$Month %in% c(1,2,3,4),]

cor(january$Temp, january$Humidity, use="complete.obs")
cor(february$Temp, february$Humidity, use="complete.obs")
cor(march$Temp, march$Humidity, use="complete.obs")
cor(april$Temp, april$Humidity, use="complete.obs")
cor(may$Temp, may$Humidity, use="complete.obs")

我只是想知道是否有一个像这样的函数:

cor(airquality$Temp, airquality$Humidity, where airquality$Month = 1)

1 个答案:

答案 0 :(得分:0)

只使用常规[进行子集。

cor(airquality[airquality$Month == 1, c("Temp", "Humidity")])