如何将几个变量复制到列

时间:2019-06-24 22:43:23

标签: r conditional-statements copy-paste

我想将几个变量复制到列中。 我目前有这样的数据。

   date      bundle_name  totbund   prod1  totprod1  prod2  totprod2  
06/01/2019      a_bund       1        a       1        b       1
06/01/2019        a          1
06/01/2019        b          2
07/01/2019      b_bund       1        b       2
07/01/2019      b_bund       2        b       4
07/01/2019        b          2

要这样

   date      bundle_name  totbund   prod1  totprod1  prod2  totprod2  
06/01/2019      a_bund       1        a       1        b       1
06/01/2019        a          1        a       1
06/01/2019        b          2        b       2
07/01/2019      b_bund       1        b       2
07/01/2019      b_bund       2        b       4
07/01/2019        b          2        b       2

因此,如果该行的prod1和totprod1列为空,我想将bundle_name中的数据复制到prod1,并将totbund中的数据复制到totprod1。 反正有做吗?非常感谢

1 个答案:

答案 0 :(得分:0)

直接使用ifelse

x$prod1 <- ifelse(is.na(x$prod1) | !nzchar(x$prod1), x$bundle_name, x$prod1)
x$totprod1 <- ifelse(is.na(x$totprod1) | !nzchar(x$totprod1), x$totbund, x$totprod1)

x
#         date bundle_name totbund prod1 totprod1 prod2 totprod2
# 1 06/01/2019      a_bund       1     a        1     b        1
# 2 06/01/2019           a       1     a        1             NA
# 3 06/01/2019           b       2     b        2             NA
# 4 07/01/2019      b_bund       1     b        2             NA
# 5 07/01/2019      b_bund       2     b        4             NA
# 6 07/01/2019           b       2     b        2             NA

由于您提到了管道(不确定您的意思):

dplyr

library(dplyr)
x %>%
  mutate(
    prod1 = if_else(is.na(prod1) | !nzchar(prod1), bundle_name, prod1),
    totprod1 = if_else(is.na(totprod1) | !nzchar(totprod1), totbund, totprod1)
  )
#         date bundle_name totbund prod1 totprod1 prod2 totprod2
# 1 06/01/2019      a_bund       1     a        1     b        1
# 2 06/01/2019           a       1     a        1             NA
# 3 06/01/2019           b       2     b        2             NA
# 4 07/01/2019      b_bund       1     b        2             NA
# 5 07/01/2019      b_bund       2     b        4             NA
# 6 07/01/2019           b       2     b        2             NA

data.table

library(data.table)
library(magrittr)
xDT <- x
setDT(xDT)
xDT %>%
  .[, totprod1 := ifelse(is.na(totprod1) | !nzchar(totprod1), totbund, totprod1) ] %>%
  .[, prod1    := ifelse(is.na(prod1) | !nzchar(prod1), bundle_name, prod1) ] %>%
  .[]
#          date bundle_name totbund prod1 totprod1 prod2 totprod2
# 1: 06/01/2019      a_bund       1     a        1     b        1
# 2: 06/01/2019           a       1     a        1             NA
# 3: 06/01/2019           b       2     b        2             NA
# 4: 07/01/2019      b_bund       1     b        2             NA
# 5: 07/01/2019      b_bund       2     b        4             NA
# 6: 07/01/2019           b       2     b        2             NA

(尾随%>% .[]只是要使其在控制台上打印,而在生产中是不必要的。)


样本数据。我添加了空字符串""来尝试模仿问题中的内容,但是我不确定它看起来像那样,因为您实际上有空字符串(并且所有数字都是字符串)还是只是手动输入以使其看起来不错。 NA由R推断,因为第一行数据中包含数字,并且空字符串在那里没有意义。

x <- read.table(header = TRUE, stringsAsFactors = FALSE, text='
   date      bundle_name  totbund   prod1  totprod1  prod2  totprod2  
06/01/2019      a_bund       1        a       1        b       1
06/01/2019        a          1       ""      ""       ""      ""
06/01/2019        b          2       ""      ""       ""      ""
07/01/2019      b_bund       1        b       2       ""      ""
07/01/2019      b_bund       2        b       4       ""      ""
07/01/2019        b          2       ""      ""       ""      ""')