在'中分配data.frame列。呼叫

时间:2015-02-05 20:58:05

标签: r dataframe

是否有一种优雅的方式可以在使用'来调用data.frame中的列。例如,我喜欢这样做:

> df <- data.frame(x=runif(5), y=runif(5))
> df
          x         y
1 0.4010225 0.1702563
2 0.7204338 0.9929117
3 0.3755553 0.9229862
4 0.2959035 0.3947730
5 0.3273934 0.3680618
> with(df, y <- cumsum(x))
> df
          x         y
1 0.4010225 0.1702563
2 0.7204338 0.9929117
3 0.3755553 0.9229862
4 0.2959035 0.3947730
5 0.3273934 0.3680618

但最终df $ y将是df $ x的累积总和。我知道df$y <- cumsum(df$x)适用于这样一个微不足道的例子,但随着事情变得越来越复杂,拥有如上所述的东西会更简单。对此有一个很好的解决方案吗?


编辑以指定多列计算。

有没有办法从within进行多列计算,而无需重新显示data.frame名称?例如

> df <- data.frame(a=runif(5), b=runif(5), c=runif(5))
> df
          a          b          c
1 0.4470582 0.57788300 0.06578355
2 0.6694826 0.13988892 0.80460530
3 0.7300993 0.78663734 0.68503691
4 0.6825741 0.07943231 0.02903320
5 0.6384533 0.42809113 0.26117171
> within(df, { x <- cumsum(a); y <- rowSums(df[,1:2]) })
          a          b          c         y         x
1 0.4470582 0.57788300 0.06578355 1.0249412 0.4470582
2 0.6694826 0.13988892 0.80460530 0.8093715 1.1165408
3 0.7300993 0.78663734 0.68503691 1.5167366 1.8466401
4 0.6825741 0.07943231 0.02903320 0.7620064 2.5292142
5 0.6384533 0.42809113 0.26117171 1.0665445 3.1676675

1 个答案:

答案 0 :(得分:2)

您可以使用transformwithin。在这两种情况下,如果您希望将结果保留,则必须将结果分配回df

> transform(df, y=cumsum(x))
          x         y
1 0.7430507 0.7430507
2 0.2858004 1.0288512
3 0.9565152 1.9853664
4 0.4379119 2.4232783
5 0.6885749 3.1118532
> within(df, y <- cumsum(x))
          x         y
1 0.7430507 0.7430507
2 0.2858004 1.0288512
3 0.9565152 1.9853664
4 0.4379119 2.4232783
5 0.6885749 3.1118532

这是一个更复杂的示例,它实际修改了df

df <- within(df, {z <- x * 2; y <- cumsum(z); rm(z)})

请注意我们rm(z),否则会将另一列添加到df