创建一个新变量,该变量从现有数据框中获取不同的列,具体取决于分组变量

时间:2013-02-07 05:34:38

标签: r

我不知道从哪里开始使用此代码。我想将一个新变量附加到现有数据框架,该数据框架根据分组变量采用不同的列。例如,假设我有列

    A  B  C  D  E  F
    1  2  3  6  11 12
    1  7  5  10 8  9
    2  19 2  4  5  6
    2  8  4  3  1  1

我想附加一个新列“G”,如果A为1,则为B列;如果A为2,则为D列

    A  B  C  D  E  F   G
    1  2  3  6  11 12  2 
    1  7  5  10 8  9   7
    2  19 2  4  5  6   4
    2  8  4  3  1  1   3

感谢

2 个答案:

答案 0 :(得分:9)

以下是几个选项。

假设您的data.frame被称为DF

基本[和索引

# make everything in G =  B
DF$G <- DF$B
# replace those cases where A==2 with D
DF$G[DF$A==2] <- DF$D[DT$A==2]

使用ifelse

只需要一个ifelse语句,因为A是1或2

DF$G <- ifelse(DF$A==2, DF$D, DF$B)

使用data.table

我喜欢data.table,以提高内存效率和编码优雅

library(data.table)
# create a data.table with A as the key

DT <- data.table(DF, key = 'A')
# where the key (A) == 1 ], then assign G = B
DT[.(1), G := B]
# and where the key (A) == 2, then assign G = D
DT[.(2), G := D]
美丽优雅!

答案 1 :(得分:5)

假设您的data.frame被称为“mydf”,您可以使用ifelse

within(mydf, {
  G <- ifelse(A == 1, B,
              ifelse(A == 2, D, 
                     0))
})
#   A  B C  D  E  F G
# 1 1  2 3  6 11 12 2
# 2 1  7 5 10  8  9 7
# 3 2 19 2  4  5  6 4
# 4 2  8 4  3  1  1 3