Question

我想从每列中选择一个不同的数据帧子集，并像这样做

per <- data.frame(Apocal=c(10,1,2,3,4,0,6),Aporos=c(0,2,1,3,0,5,6),Euker=c(0,3,5,7,0,0,0), fecha=c(1,1,2,2,2,3,3))

temp <-with(per, per[Apocal>0,])
require(plyr)
temp <- ddply(temp, .(fecha), summarise, Apocal = mean(Apocal))

temp <-with(per, per[Aporos>0,])
temp <- ddply(temp, .(fecha), summarise, Aporos = mean(Aporos))

...

并重复每一列，除了fecha，有没有办法通过函数或其他东西自动执行此操作？

谢谢！

Answer 1

使用aggregate：

aggregate(. ~ fecha, data = per, function(x)mean(x[x > 0]))
#   fecha Apocal Aporos Euker
# 1     1    5.5    2.0     3
# 2     2    3.0    2.0     6
# 3     3    6.0    5.5   NaN

Answer 2

如果您的函数是mean，则可以正常使用函数colMeans。它计算所有列的平均值（按列方式）。但是，由于您需要在删除每个列的0个条目后计算平均值，您可以使用colSums，如下所示：

# x gets all columns grouped by `fecha`. ddply(per, .(fecha), function(x) colSums(x[, -4])/colSums(x[, -4] != 0)) # fecha Apocal Aporos Euker # 1 1 5.5 2.0 3 # 2 2 3.0 2.0 6 # 3 3 6.0 5.5 NaN

Answer 3

pmean <- function(x,byvar){
  y=x[,-1*byvar]
  colSums(y*(y>0))/colSums(y>0)
}

ddply(per, .(fecha), function(x) pmean(x,4))

Arun的解决方案的修改版本。

选择不同data.frame列的子集

3 个答案: