我是R.的新手。这是我的具体问题。
假设我正在使用下面这个名为“data”的数据集。我的标题为state
,type
和value
。
structure(list(state = structure(c(1L, 1L, 1L, 1L, 2L, 2L), .Label = c("AK",
"AL"), class = "factor"), type = structure(c(2L, 2L, 1L, 1L,
2L, 1L), .Label = c(" D", " R"), class = "factor"), value = c(100L,
200L, 100L, 150L, 100L, 150L)), .Names = c("state", "type", "value"
), class = "data.frame", row.names = c(NA, -6L))
state type value
1 AK R 100
2 AK R 200
3 AK D 100
4 AK D 150
5 AL R 100
6 AL D 150
我想编写一个函数,它将为每种类型和状态添加值。例如。对于AK
类型R
,输出将为300.对于AK
类型D
,输出将为250.对于AL
类型R
输出将为100,对于AL
类型D
,输出将为150.
答案 0 :(得分:7)
不是plyr,只是aggregate
> aggregate(value~state+type, data=data,FUN=sum)
state type value
1 AK D 250
2 AL D 150
3 AK R 300
4 AL R 100
答案 1 :(得分:5)
您可以使用tapply
data <- read.csv(header=TRUE,text="state, type, value
AK, R, 100
AK, R, 200
AK, D, 100
AK, D, 150
AL, R, 100
AL, D, 150")
tapply(data$value, list(data$state,data$type), sum)
# D R
# AK 250 300
# AL 150 100
答案 2 :(得分:5)
虽然@Matthew Lundberg的答案是最好的,但这里有一些替代方案。
如果你真的想使用plyr,你可以这样做:
ddply(DF, .(state, type), numcolwise(sum))
state type value
1 AK D 250
2 AK R 300
3 AL D 150
4 AL R 100
这是使用reshape2包
的另一种解决方案library(reshape2)
dcast( melt(DF), state + type ~ variable, sum)
Using state, type as id variables
state type value
1 AK D 250
2 AK R 300
3 AL D 150
4 AL R 100
如果你只想要一个向量,那么这可能很有用:
sapply(with(DF, split(value, list(state, type))), sum)
AK.D AL.D AK.R AL.R
250 150 300 100
答案 3 :(得分:3)
plyr解决方案将是:
ddply(data, .(state,type),summarise, total=sum(value, na.rm = TRUE))
# state type total
# 1 AK D 250
# 2 AK R 300
# 3 AL D 150
# 4 AL R 100
答案 4 :(得分:3)
为了完整起见,还有“data.table”包和基础R中的by
。假设您的数据集名为“myd”:
by(myd$value, list(myd$state, myd$type), FUN=sum)
# : AK
# : D
# [1] 250
# ------------------------------------------------------------------------------
# : AL
# : D
# [1] 150
# ------------------------------------------------------------------------------
# : AK
# : R
# [1] 300
# ------------------------------------------------------------------------------
# : AL
# : R
# [1] 100
library(data.table)
DT <- data.table(myd)
DT[, sum(value), by = "state,type"]
# state type V1
# 1: AK R 300
# 2: AK D 250
# 3: AL R 100
# 4: AL D 150