Question

df <- data.frame("ref" = c("A","A","B","B","C","C","C"),
                 "trans" = c("R","MTA","N","MTA","MTA","MTA","MTA"))

  ref trans
1   A     R
2   A   MTA
3   B     N
4   B   MTA
5   C   MTA
6   C   MTA
7   C   MTA

我想创建一个新列，为每个引用选择值“ R”或“ N”，并为每一行重复该值。如果不存在值“ R”或“ N”，则该列到处都应该简单地具有值“ N”。

我尝试过这样的事情：

df %>% group_by (ref,trans) %>% arrange(desc(ref), desc(trans)) %>% mutate(result = trans[1L])

但不起作用。（请注意，分组依据是必填项，因为我的数据集更精细）。

结果应该是

  ref trans result
1   A     R      R
2   A   MTA      R
3   B     N      N
4   B   MTA      N
5   C   MTA      N
6   C   MTA      N
7   C   MTA      N

最好使用dplyr解决方案

Answer 1

在case_when中使用mutate将适用于您提供的示例。尽管有ref和"R"的{{1}}没有？

"N"

Answer 2

可以尝试：

library(dplyr)

df %>%
  group_by(ref) %>%
  mutate(result = c('N', 'R')[any(trans == 'R') + 1])

输出：

# A tibble: 7 x 3
# Groups:   ref [3]
  ref   trans result
  <fct> <fct> <chr> 
1 A     R     R     
2 A     MTA   R     
3 B     N     N     
4 B     MTA   N     
5 C     MTA   N     
6 C     MTA   N     
7 C     MTA   N

根据其他结果创建一个新列

2 个答案: