我想将几个变量复制到列中。 我目前有这样的数据。
date bundle_name totbund prod1 totprod1 prod2 totprod2
06/01/2019 a_bund 1 a 1 b 1
06/01/2019 a 1
06/01/2019 b 2
07/01/2019 b_bund 1 b 2
07/01/2019 b_bund 2 b 4
07/01/2019 b 2
要这样
date bundle_name totbund prod1 totprod1 prod2 totprod2
06/01/2019 a_bund 1 a 1 b 1
06/01/2019 a 1 a 1
06/01/2019 b 2 b 2
07/01/2019 b_bund 1 b 2
07/01/2019 b_bund 2 b 4
07/01/2019 b 2 b 2
因此,如果该行的prod1和totprod1列为空,我想将bundle_name中的数据复制到prod1,并将totbund中的数据复制到totprod1。 反正有做吗?非常感谢
答案 0 :(得分:0)
直接使用ifelse
:
x$prod1 <- ifelse(is.na(x$prod1) | !nzchar(x$prod1), x$bundle_name, x$prod1)
x$totprod1 <- ifelse(is.na(x$totprod1) | !nzchar(x$totprod1), x$totbund, x$totprod1)
x
# date bundle_name totbund prod1 totprod1 prod2 totprod2
# 1 06/01/2019 a_bund 1 a 1 b 1
# 2 06/01/2019 a 1 a 1 NA
# 3 06/01/2019 b 2 b 2 NA
# 4 07/01/2019 b_bund 1 b 2 NA
# 5 07/01/2019 b_bund 2 b 4 NA
# 6 07/01/2019 b 2 b 2 NA
由于您提到了管道(不确定您的意思):
dplyr
library(dplyr)
x %>%
mutate(
prod1 = if_else(is.na(prod1) | !nzchar(prod1), bundle_name, prod1),
totprod1 = if_else(is.na(totprod1) | !nzchar(totprod1), totbund, totprod1)
)
# date bundle_name totbund prod1 totprod1 prod2 totprod2
# 1 06/01/2019 a_bund 1 a 1 b 1
# 2 06/01/2019 a 1 a 1 NA
# 3 06/01/2019 b 2 b 2 NA
# 4 07/01/2019 b_bund 1 b 2 NA
# 5 07/01/2019 b_bund 2 b 4 NA
# 6 07/01/2019 b 2 b 2 NA
data.table
library(data.table)
library(magrittr)
xDT <- x
setDT(xDT)
xDT %>%
.[, totprod1 := ifelse(is.na(totprod1) | !nzchar(totprod1), totbund, totprod1) ] %>%
.[, prod1 := ifelse(is.na(prod1) | !nzchar(prod1), bundle_name, prod1) ] %>%
.[]
# date bundle_name totbund prod1 totprod1 prod2 totprod2
# 1: 06/01/2019 a_bund 1 a 1 b 1
# 2: 06/01/2019 a 1 a 1 NA
# 3: 06/01/2019 b 2 b 2 NA
# 4: 07/01/2019 b_bund 1 b 2 NA
# 5: 07/01/2019 b_bund 2 b 4 NA
# 6: 07/01/2019 b 2 b 2 NA
(尾随%>% .[]
只是要使其在控制台上打印,而在生产中是不必要的。)
样本数据。我添加了空字符串""
来尝试模仿问题中的内容,但是我不确定它看起来像那样,因为您实际上有空字符串(并且所有数字都是字符串)还是只是手动输入以使其看起来不错。 NA
由R推断,因为第一行数据中包含数字,并且空字符串在那里没有意义。
x <- read.table(header = TRUE, stringsAsFactors = FALSE, text='
date bundle_name totbund prod1 totprod1 prod2 totprod2
06/01/2019 a_bund 1 a 1 b 1
06/01/2019 a 1 "" "" "" ""
06/01/2019 b 2 "" "" "" ""
07/01/2019 b_bund 1 b 2 "" ""
07/01/2019 b_bund 2 b 4 "" ""
07/01/2019 b 2 "" "" "" ""')