我正在尝试使用列中的值来提取数据框中的列号。我的问题类似于r-bloggers中的该主题。在此处复制脚本:
df <- data.frame(x = c(1, 2, 3, 4),
y = c(5, 6, 7, 8),
choice = c("x", "y", "x", "z"),
stringsAsFactors = FALSE)
但是,我没有列名在choice
中,而是拥有列索引号,这样我的数据框看起来像这样:
df <- data.frame(x = c(1, 2, 3, 4),
y = c(5, 6, 7, 8),
choice = c(1, 2, 1, 3),
stringsAsFactors = FALSE)
我尝试使用此解决方案:
df$newValue <-
df[cbind(
seq_len(nrow(df)),
match(df$choice, colnames(df))
)]
与其给我输出类似这样的输出:
# x y choice newValue
# 1 1 4 1 1
# 2 2 5 2 2
# 3 3 6 1 6
# 4 8 9 3 NA
我的newValue
列返回所有NA。
# x y choice newValue
# 1 1 4 1 NA
# 2 2 5 2 NA
# 3 3 6 1 NA
# 4 8 9 3 NA
我应该在代码中进行哪些修改,以便它将choice
列读取为列索引?
答案 0 :(得分:2)
由于您已经有需要从数据框中提取的列号,因此此处不需要match
。但是,由于在数据提取过程中您不想考虑的数据中有一个名为choice
的列,因此在从数据帧进行子集设置之前,我们需要将不在该范围内的值转换为NA
。
mat <- cbind(seq_len(nrow(df)), df$choice)
mat[mat[, 2] > (ncol(df) -1), ] <- NA
df$newValue <- df[mat]
df
# x y choice newValue
#1 1 5 1 1
#2 2 6 2 6
#3 3 7 1 3
#4 4 8 3 NA
数据
df <- data.frame(x = c(1, 2, 3, 4),
y = c(5, 6, 7, 8),
choice = c(1, 2, 1, 3))