我有一个数据框,例如df,并且想要创建列来生成df2。
df <- data.frame(bind_cols(x = c('N', 'Y', 'N', 'Y', 'N'),
y = c(NA, 'N', 'Y', 'Y', 'N')))
df2 <- data.frame(bind_cols(x = c('N', 'Y', 'N', 'Y', 'N'),
y = c(NA, 'N', 'Y', 'Y', 'N'),
any = c('N', 'Y', 'Y', 'Y', 'N'),
both = c('N', 'N', 'N', 'Y', 'N')))
如果x和y =='Y'中的任何一个或另一个,则新列'any'应该='Y'。如果x和y =='Y',则两者都应为'Y'。 我还没想出如何在第一行处理NA以使any ='Y'。我目前的策略如下,但在第1行,“任意”列中给出NA,我想要='Y'。即使存在NA值,如何更改代码以得到Y的结果?
df2 <- df %>%
mutate(any = case_when(x =='Y'|y=='Y' ~'Y',
x != 'Y' & y != 'Y' ~ 'N'),
both = ifelse(x=='Y'& y=='Y', 'Y', 'N'))
答案 0 :(得分:1)
您可以使用基数为R的any
和all
函数与na.rm = T
。它们都对向量进行操作,因此您需要在rowwise
之前添加mutate
,以便将每行的x
和y
值一起视为向量,而不是所有x
值和所有y
值。
library(tidyverse)
df %>%
rowwise() %>%
mutate(any = ifelse(any(x == "Y", y == "Y", na.rm = T), "Y", "N")) %>%
mutate(both = ifelse(all(x == "Y", y == "Y", na.rm = T), "Y", "N"))
#> Source: local data frame [5 x 4]
#> Groups: <by row>
#>
#> # A tibble: 5 x 4
#> x y any both
#> <chr> <chr> <chr> <chr>
#> 1 N <NA> N N
#> 2 Y N Y N
#> 3 N Y Y N
#> 4 Y Y Y Y
#> 5 N N N N
由reprex package(v0.2.0)创建于2018-05-07。
答案 1 :(得分:0)
您可以尝试case_when
或ifelse
。直接使用%in%
代替==
处理NA
的
df %>%
mutate(any=case_when(x %in% "Y" | y %in% "Y" ~ "Y", TRUE ~ "N"),
both=ifelse(x %in% "Y" & y %in% "Y", "Y", "N"))
x y any both
1 N <NA> N N
2 Y N Y N
3 N Y Y N
4 Y Y Y Y
5 N N N N
无需rowwise
。