我有一个数据框,我想在name1
,name2
和name3
中粘贴不包含NA
的元素。
c <- data.frame(name1 = letters[1:3],
name2 = c('A', NA, 'C'),
name3 = c('pig', 'cow', NA)
)
结果应如下:
c %>% mutate(new_name = c('a&A&pig', 'b&cow', 'c&C'))
当我使用paste0()
时,它将绑定包括NA
在内的所有元素。我不要这个。
c %>% mutate(new_name = paste0(name1,'&', name2, '&', name3))
然后我尝试了另外两种方法。一种是用group_split()
将数据帧分成列表,另一种是用index
嵌套数据帧。然后在两种方法之后使用map()
和select()
选择不包含NA
但全部失败的列。
c %>%
mutate(index = row_number()) %>%
group_split(index) %>%
map(select(~where(~!any(is.na(.)))))
c %>%
mutate(index = row_number()) %>%
nest(data = name1:name3) %>%
mutate(without_NA_data = map(data, select(~where(~!any(is.na(.))))))
有什么办法可以得到我想要的东西吗? 任何帮助将不胜感激!
答案 0 :(得分:2)
我们可以通过仅加载rowwise
个软件包来将c_across
与dplyr
一起使用
library(dplyr)
c %>%
rowwise %>%
mutate(new_name = paste(na.omit(c_across(everything())), collapse="&")) %>%
ungroup
# A tibble: 3 x 4
# name1 name2 name3 new_name
# <chr> <chr> <chr> <chr>
#1 a A pig a&A&pig
#2 b <NA> cow b&cow
#3 c C <NA> c&C
或与pmap
library(purrr)
c %>%
mutate(new_name = pmap_chr(., ~ paste(na.omit(c(...)), collapse="&")))
# name1 name2 name3 new_name
#1 a A pig a&A&pig
#2 b <NA> cow b&cow
#3 c C <NA> c&C
或者将base R
与paste
和replace
一起使用
trimws(do.call(paste, c(replace(c, is.na(c), ''), sep="&")), whitespace = "&")
#[1] "a&A&pig" "b&&cow" "c&C"
或使用apply
apply(c, 1, function(x) paste(na.omit(x), collapse="&"))
#[1] "a&A&pig" "b&cow" "c&C"
或者首先paste
并删除NA
子字符串
gsub("&NA|NA&|NA$", "", do.call(paste, c(c, sep="&")))
#[1] "a&A&pig" "b&cow" "c&C"
答案 1 :(得分:1)
我们可以使用unite
从tidyr
中使用na.rm = TRUE
来删除NA
值
tidyr::unite(c, new_name, starts_with('name'),
sep = '&', na.rm = TRUE, remove = FALSE)
# new_name name1 name2 name3
#1 a&A&pig a A pig
#2 b&cow b <NA> cow
#3 c&C c C <NA>