使用列作为列索引从R中的数据框中提取值

时间:2019-11-14 03:54:27

标签: r indexing extraction

我正在尝试使用列中的值来提取数据框中的列号。我的问题类似于r-bloggers中的该主题。在此处复制脚本:

df <- data.frame(x = c(1, 2, 3, 4),
                 y = c(5, 6, 7, 8),
                 choice = c("x", "y", "x", "z"),
                 stringsAsFactors = FALSE)

但是,我没有列名在choice中,而是拥有列索引号,这样我的数据框看起来像这样:

df <- data.frame(x = c(1, 2, 3, 4),
                 y = c(5, 6, 7, 8),
                 choice = c(1, 2, 1, 3),
                 stringsAsFactors = FALSE)

我尝试使用此解决方案:

df$newValue <-
  df[cbind(
    seq_len(nrow(df)),
    match(df$choice, colnames(df))
  )]

与其给我输出类似这样的输出:

#   x y choice newValue
# 1 1 4   1        1
# 2 2 5   2        2
# 3 3 6   1        6
# 4 8 9   3        NA

我的newValue列返回所有NA。

    # x y choice newValue
    # 1 1 4   1        NA
    # 2 2 5   2        NA
    # 3 3 6   1        NA
    # 4 8 9   3        NA

我应该在代码中进行哪些修改,以便它将choice列读取为列索引?

1 个答案:

答案 0 :(得分:2)

由于您已经有需要从数据框中提取的列号,因此此处不需要match。但是,由于在数据提取过程中您不想考虑的数据中有一个名为choice的列,因此在从数据帧进行子集设置之前,我们需要将不在该范围内的值转换为NA

mat <- cbind(seq_len(nrow(df)), df$choice)
mat[mat[, 2] > (ncol(df) -1), ] <- NA 
df$newValue <- df[mat]

df
#  x y choice newValue
#1 1 5      1        1
#2 2 6      2        6
#3 3 7      1        3
#4 4 8      3       NA

数据

df <- data.frame(x = c(1, 2, 3, 4),
                 y = c(5, 6, 7, 8),
                 choice = c(1, 2, 1, 3))