将具有条件的列元素粘贴到r

时间:2020-09-30 02:17:25

标签: r dplyr

我有一个数据框,我想在name1name2name3中粘贴不包含NA的元素。

c <- data.frame(name1 = letters[1:3],
                name2 = c('A', NA, 'C'),
                name3 = c('pig', 'cow', NA)
                )

结果应如下:

c %>% mutate(new_name = c('a&A&pig', 'b&cow', 'c&C'))

当我使用paste0()时,它将绑定包括NA在内的所有元素。我不要这个。

c %>% mutate(new_name = paste0(name1,'&', name2, '&', name3))

然后我尝试了另外两种方法。一种是用group_split()将数据帧分成列表,另一种是用index嵌套数据帧。然后在两种方法之后使用map()select()选择不包含NA但全部失败的列。

 c %>% 
  mutate(index = row_number()) %>% 
  group_split(index) %>% 
  map(select(~where(~!any(is.na(.)))))

c %>% 
  mutate(index = row_number()) %>% 
  nest(data = name1:name3) %>% 
  mutate(without_NA_data = map(data, select(~where(~!any(is.na(.))))))

有什么办法可以得到我想要的东西吗? 任何帮助将不胜感激!

2 个答案:

答案 0 :(得分:2)

我们可以通过仅加载rowwise个软件包来将c_acrossdplyr一起使用

library(dplyr)    
c %>% 
   rowwise %>% 
   mutate(new_name = paste(na.omit(c_across(everything())), collapse="&")) %>%
   ungroup
# A tibble: 3 x 4
# name1 name2 name3 new_name
#  <chr> <chr> <chr> <chr>   
#1 a     A     pig   a&A&pig 
#2 b     <NA>  cow   b&cow   
#3 c     C     <NA>  c&C    

或与pmap

library(purrr)
c %>% 
     mutate(new_name = pmap_chr(., ~ paste(na.omit(c(...)), collapse="&")))
#  name1 name2 name3 new_name
#1     a     A   pig  a&A&pig
#2     b  <NA>   cow    b&cow
#3     c     C  <NA>      c&C

或者将base Rpastereplace一起使用

trimws(do.call(paste, c(replace(c, is.na(c), ''), sep="&")), whitespace = "&")
#[1] "a&A&pig" "b&&cow"  "c&C"  

或使用apply

apply(c, 1, function(x)  paste(na.omit(x), collapse="&"))
#[1] "a&A&pig" "b&cow"   "c&C"  

或者首先paste并删除NA子字符串

gsub("&NA|NA&|NA$", "", do.call(paste, c(c, sep="&")))
#[1] "a&A&pig" "b&cow"   "c&C"    

答案 1 :(得分:1)

我们可以使用unitetidyr中使用na.rm = TRUE来删除NA

tidyr::unite(c, new_name, starts_with('name'), 
                sep = '&', na.rm = TRUE, remove = FALSE)

#  new_name name1 name2 name3
#1  a&A&pig     a     A   pig
#2    b&cow     b  <NA>   cow
#3      c&C     c     C  <NA>