如何使用dplyr获得两列的平均值?

时间:2015-12-09 01:26:12

标签: r dplyr mean

如何使用dplyr获取数据表的两列平均值?例如,如果我的数据如下所示:

dt <- data.table(A=1:5, B=c(1,4,NA,6,8))

我想创建一个新列“Avg”,它是每行的A列和B列的平均值:

dt %>% mutate(Avg=mean(c(A, B), na.rm=T))

但是这段代码并没有给我正确的结果。这该怎么做?非常感谢你。

3 个答案:

答案 0 :(得分:14)

如果您想使用dplyr实现此目的,我建议使用函数rowwise()

    R> library(dplyr)
    R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
    R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T)) 
    R> j
Source: local data frame [5 x 3]
Groups: <by row>

      A     B   Avg
  (int) (dbl) (dbl)
1     1     1   1.0
2     2     4   3.0
3     3    NA   3.0
4     4     6   5.0
5     5     8   6.5

答案 1 :(得分:10)

怎么样

dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))

mean没有矢量化。它将所有输入折叠为单个值。如果您使用cbind()创建矩阵,则可以使用rowMeans来执行此操作。

答案 2 :(得分:1)

由于初始数据集为data.table,我们可以使用data.table方法

dt[, Avg:= mean(unlist(.SD), na.rm=TRUE) , .1:nrow(dt)]
dt
#   A  B Avg
#1: 1  1 1.0
#2: 2  4 3.0
#3: 3 NA 3.0
#4: 4  6 5.0
#5: 5  8 6.5