允许在聚合函数中使用NA进行分组

时间:2015-06-23 07:20:01

标签: r aggregate

这是虚拟数据

temp.df <- data.frame(count = rep(1,6), x = c(1,1,NA,NA,3,10), y=c("A","A","A","A","B","B"))

当我按以下方式应用汇总时:

aggregate(count ~ x + y, data=temp.df, FUN=sum, na.rm=FALSE, na.action=na.pass)

我明白了:

   x y count
1  1 A     2
2  3 B     1
3 10 B     1

但是,我想要以下输出:

   x  y count
1  NA A     2
2  1  A     2
3  3  B     1
4 10  B     1

希望它有意义。谢谢。

2 个答案:

答案 0 :(得分:4)

使用addNANA视为x的不同级别。

> temp.df$x <- addNA(temp.df$x)
> aggregate(count ~ x + y, data=temp.df, FUN=sum, na.rm=FALSE, na.action=na.pass)
     x y count
1    1 A     2
2 <NA> A     2
3    3 B     1
4   10 B     1

答案 1 :(得分:2)

一个选项可能是将NA转换为字符"NA"(但我不确定为什么需要缺少值)

temp.df$x[is.na(temp.df$x)] <- 'NA'
aggregate(count ~ x + y, data=temp.df, FUN=sum, na.rm=FALSE, na.action=na.pass)
#   x y count
#1  1 A     2
#2 NA A     2
#3 10 B     1
#4  3 B     1