如何添加行中包含的特定数据?

时间:2012-12-30 00:13:55

标签: r plyr

我是R.的新手。这是我的具体问题。 假设我正在使用下面这个名为“data”的数据集。我的标题为statetypevalue

structure(list(state = structure(c(1L, 1L, 1L, 1L, 2L, 2L), .Label = c("AK", 
"AL"), class = "factor"), type = structure(c(2L, 2L, 1L, 1L, 
2L, 1L), .Label = c(" D", " R"), class = "factor"), value = c(100L, 
200L, 100L, 150L, 100L, 150L)), .Names = c("state", "type", "value"
), class = "data.frame", row.names = c(NA, -6L))



  state type value
1    AK    R   100
2    AK    R   200
3    AK    D   100
4    AK    D   150
5    AL    R   100
6    AL    D   150

我想编写一个函数,它将为每种类型和状态添加值。例如。对于AK类型R,输出将为300.对于AK类型D,输出将为250.对于AL类型R输出将为100,对于AL类型D,输出将为150.

5 个答案:

答案 0 :(得分:7)

不是plyr,只是aggregate

> aggregate(value~state+type, data=data,FUN=sum)
  state type value
1    AK    D   250
2    AL    D   150
3    AK    R   300
4    AL    R   100

答案 1 :(得分:5)

您可以使用tapply

data <- read.csv(header=TRUE,text="state, type, value
AK, R, 100
AK, R, 200
AK, D, 100
AK, D, 150
AL, R, 100
AL, D, 150")

tapply(data$value, list(data$state,data$type), sum)
#     D   R
# AK  250 300
# AL  150 100

答案 2 :(得分:5)

虽然@Matthew Lundberg的答案是最好的,但这里有一些替代方案。

如果你真的想使用plyr,你可以这样做:

ddply(DF, .(state, type), numcolwise(sum))
  state type value
1    AK    D   250
2    AK    R   300
3    AL    D   150
4    AL    R   100

这是使用reshape2包

的另一种解决方案
library(reshape2)
dcast( melt(DF), state + type ~ variable, sum)
Using state, type as id variables
  state type value
1    AK    D   250
2    AK    R   300
3    AL    D   150
4    AL    R   100

如果你只想要一个向量,那么这可能很有用:

sapply(with(DF, split(value, list(state, type))), sum)
AK.D  AL.D  AK.R  AL.R 
250   150   300   100 

答案 3 :(得分:3)

plyr解决方案将是:

ddply(data, .(state,type),summarise, total=sum(value, na.rm = TRUE))
#   state type total
# 1    AK    D   250
# 2    AK    R   300
# 3    AL    D   150
# 4    AL    R   100

答案 4 :(得分:3)

为了完整起见,还有“data.table”包和基础R中的by。假设您的数据集名为“myd”:

by(myd$value, list(myd$state, myd$type), FUN=sum)
# : AK
# :  D
# [1] 250
# ------------------------------------------------------------------------------ 
# : AL
# :  D
# [1] 150
# ------------------------------------------------------------------------------ 
# : AK
# :  R
# [1] 300
# ------------------------------------------------------------------------------ 
# : AL
# :  R
# [1] 100

library(data.table)
DT <- data.table(myd)
DT[, sum(value), by = "state,type"]
#    state type  V1
# 1:    AK    R 300
# 2:    AK    D 250
# 3:    AL    R 100
# 4:    AL    D 150