Question

我想将一些列与一些文本粘贴在一起，只有当至少有一个不是NA并且我当前的解决方案有效时才合并它们，但是很麻烦。所以我想知道是否有更简洁的方法来做到这一点（创建下面的“组合”栏）。我想使用tidyr，但似乎没有办法在unite（）

中指定如何处理缺失值

谢谢，我希望我没有错过任何明显的东西。

df = data.frame(num=c(1,2,NA,NA),place=c("Rome",NA,"Paris",NA))

df$combine[!is.na(df$num)|!is.na(df$place)] = 
  paste(df$num[!is.na(df$num)|!is.na(df$place)],
        "days in",df$place[!is.na(df$num)|!is.na(df$place)]) 

# df
#   num place          combine
# 1   1  Rome   1 days in Rome
# 2   2  <NA>     2 days in NA
# 3  NA Paris NA days in Paris
# 4  NA  <NA>             <NA>

Answer 1

每当你发现自己再次计算相同的东西（这里：index）时，尝试存储它并重用该对象以避免冗余计算。对于您的示例，您可以按如下方式计算非NA索引：

idx <- rowSums(!is.na(df)) > 0

然后，您可以使用它将相关行粘贴在一起：

df[idx, "combine"] <- with(df[idx, ], paste(num, "days in", place))

Answer 2

我们可以将mutate与ifelse

中的dplyr一起使用

library(dplyr)
df %>%
   mutate(combine = ifelse(rowSums(!is.na(.))>0, paste(num, "days in", place), NA))
#    num place          combine
#1   1  Rome   1 days in Rome
#2   2  <NA>     2 days in NA
#3  NA Paris NA days in Paris
#4  NA  <NA>      <NA>

或使用data.table

library(data.table)
setDT(df)[df[, !Reduce(`&`, lapply(.SD, is.na))], combine := paste(num, "days in", place)]
df
#   num place          combine
#1:   1  Rome   1 days in Rome
#2:   2    NA     2 days in NA
#3:  NA Paris NA days in Paris
#4:  NA    NA               NA

将子集列粘贴在一起

2 个答案: