处理条件列中的NA

时间:2018-05-07 14:28:33

标签: r dataframe dplyr conditional

我有一个数据框,例如df,并且想要创建列来生成df2。

df <- data.frame(bind_cols(x = c('N', 'Y', 'N', 'Y', 'N'),
                   y = c(NA, 'N', 'Y', 'Y', 'N')))

df2 <- data.frame(bind_cols(x = c('N', 'Y', 'N', 'Y', 'N'),
                        y = c(NA, 'N', 'Y', 'Y', 'N'),
                        any = c('N', 'Y', 'Y', 'Y', 'N'),
                        both = c('N', 'N', 'N', 'Y', 'N')))

如果x和y =='Y'中的任何一个或另一个,则新列'any'应该='Y'。如果x和y =='Y',则两者都应为'Y'。 我还没想出如何在第一行处理NA以使any ='Y'。我目前的策略如下,但在第1行,“任意”列中给出NA,我想要='Y'。即使存在NA值,如何更改代码以得到Y的结果?

df2 <- df %>% 
  mutate(any = case_when(x =='Y'|y=='Y' ~'Y',
                         x != 'Y' & y != 'Y' ~ 'N'),
                both = ifelse(x=='Y'& y=='Y', 'Y', 'N')) 

2 个答案:

答案 0 :(得分:1)

您可以使用基数为R的anyall函数与na.rm = T。它们都对向量进行操作,因此您需要在rowwise之前添加mutate,以便将每行的xy值一起视为向量,而不是所有x值和所有y值。

library(tidyverse)

df %>%
    rowwise() %>%
    mutate(any = ifelse(any(x == "Y", y == "Y", na.rm = T), "Y", "N")) %>%
    mutate(both = ifelse(all(x == "Y", y == "Y", na.rm = T), "Y", "N"))
#> Source: local data frame [5 x 4]
#> Groups: <by row>
#> 
#> # A tibble: 5 x 4
#>   x     y     any   both 
#>   <chr> <chr> <chr> <chr>
#> 1 N     <NA>  N     N    
#> 2 Y     N     Y     N    
#> 3 N     Y     Y     N    
#> 4 Y     Y     Y     Y    
#> 5 N     N     N     N

reprex package(v0.2.0)创建于2018-05-07。

答案 1 :(得分:0)

您可以尝试case_whenifelse。直接使用%in%代替== 处理NA

df %>% 
  mutate(any=case_when(x %in% "Y" | y %in% "Y" ~ "Y", TRUE ~ "N"),
         both=ifelse(x %in% "Y" & y %in% "Y", "Y", "N"))
  x    y any both
1 N <NA>   N    N
2 Y    N   Y    N
3 N    Y   Y    N
4 Y    Y   Y    Y
5 N    N   N    N

无需rowwise