如何从某个数据框的n
列构造值向量,其中n
是某个向量中定义的每行值?例如:
> df <- data.frame(a=c(100, 110, 120, 130, 140),
b=c(200, 210, 220, 230, 240),
c=c(300, 310, 320, 330, 340))
> df
a b c
1 100 200 300
2 110 210 310
3 120 220 320
4 130 230 330
5 140 240 340
> cl <- c(1, 3, 3, 2, 1)
> some.function(df, cl)
会导致:
[1] 100 310 320 230 140
答案 0 :(得分:3)
您可以使用2列矩阵进行索引 - 第一列是行号,第二列是列号。
df[cbind(seq(cl), cl)]
# [1] 100 310 320 230 140
这是一个矢量化操作,应该比使用sapply
之类的行循环更快,并从该行中获取适当的值:
# Slightly larger example, with 1000 rows
set.seed(144)
df <- matrix(rnorm(3000), nrow=1000)
cl <- sample(3, 1000, replace=TRUE)
all.equal(df[cbind(seq(cl), cl)], sapply(seq(nrow(df)), function(i) df[i, cl[i]]))
# [1] TRUE
library(microbenchmark)
microbenchmark(df[cbind(seq(cl), cl)], sapply(seq(nrow(df)), function(i) df[i, cl[i]]))
# Unit: microseconds
# expr min lq mean median
# df[cbind(seq(cl), cl)] 23.828 26.335 34.26012 30.0350
# sapply(seq(nrow(df)), function(i) df[i, cl[i]]) 855.481 922.449 1178.47502 996.3815
# uq max neval
# 38.0315 135.894 100
# 1111.3960 3414.374 100