有条件地将mutate_at应用于R中数据框中的特定行

时间:2018-08-21 02:16:48

标签: r if-statement dplyr conditional-statements tidyverse

我在R中有一个数据帧,如下所示:

a  b  c  condition
1  4  2  acap
2  3  1  acap
2  4  3  acap
5  6  8  ncap
5  7  6  ncap
8  7  6  ncap

我试图重新编码条件ncap(以及此处未显示的2个其他条件)的a,b和c列中的值,同时不保留acap的值。

以下代码适用于前三列。我试图弄清楚如何将其仅应用于按条件指定的行,同时将所有内容保留在同一数据框中。

df = df %>%
     mutate_at(vars(a:c), function(x) 
     case_when x == 5 ~ 1, x == 6 ~ 2, x == 7 ~ 3, x == 8 ~ 4)

这是预期的输出。

a  b  c  condition
1  4  2  acap
2  3  1  acap
2  4  3  acap
1  2  4  ncap
1  3  2  ncap
4  3  2  ncap

我一直在寻找这个问题的答案,但找不到。如果有人知道已经存在的答案,我将不胜感激。

2 个答案:

答案 0 :(得分:3)

您可以使用filter将重新编码值仅应用于特定的行(此处不等于“ acap”)

library(dplyr)
df %>%
  filter(condition != "acap") %>%
  mutate_at(vars(a:c), function(x) 
  case_when(x == 5 ~ 1, x == 6 ~ 2, x == 7 ~ 3, x == 8 ~ 4)) 

#  a b c condition
#1 1 2 4      ncap
#2 1 3 2      ncap
#3 4 3 2      ncap

如果您再次需要整个数据框,我们可以做

df %>%
  filter(condition == "acap") %>%
  bind_rows(df %>%
     filter(condition != "acap") %>%
     mutate_at(vars(a:c), function(x) 
    case_when(x == 5 ~ 1, x == 6 ~ 2, x == 7 ~ 3, x == 8 ~ 4)))

#  a b c condition
#1 1 4 2      acap
#2 2 3 1      acap
#3 2 4 3      acap
#4 1 2 4      ncap
#5 1 3 2      ncap
#6 4 3 2      ncap

答案 1 :(得分:2)

我们可以在用case_when创建的条件下使用row_number,即如果行号是4到6,则从该值中减去4,否则返回该值。

df %>% 
   mutate_at(vars(a:c), funs(case_when(row_number() %in% 4:6 ~ . - 4L, 
                                       TRUE ~ .)))
#  a b c condition
#1 1 4 2      acap
#2 2 3 1      acap
#3 2 4 3      acap
#4 1 2 4      ncap
#5 1 3 2      ncap
#6 4 3 2      ncap

如果这是基于值而不是行,请在值上创建条件

df %>% 
   mutate_at(vars(a:c), funs(case_when(. %in% 5:8 ~ . - 4L, 
                                       TRUE ~ .)))
#  a b c condition
#1 1 4 2      acap
#2 2 3 1      acap
#3 2 4 3      acap
#4 1 2 4      ncap
#5 1 3 2      ncap
#6 4 3 2      ncap

或者如果它基于“条件”中的值

df %>% 
   mutate_at(vars(a:c), funs(case_when(condition == 'ncap' ~ . - 4L, 
                                       TRUE ~ .)))

或者不使用任何case_when

df %>% 
  mutate_at(vars(a:c), funs( . - c(0, 4)[(condition == 'ncap')+1]))
#  a b c condition
#1 1 4 2      acap
#2 2 3 1      acap
#3 2 4 3      acap
#4 1 2 4      ncap
#5 1 3 2      ncap
#6 4 3 2      ncap

base R中,我们可以通过创建索引来实现

i1 <- df$condition =='ncap'
df[i1, 1:3] <- df[i1, 1:3] - 4

数据

df <- structure(list(a = c(1L, 2L, 2L, 5L, 5L, 8L), b = c(4L, 3L, 4L, 
 6L, 7L, 7L), c = c(2L, 1L, 3L, 8L, 6L, 6L), condition = c("acap", 
 "acap", "acap", "ncap", "ncap", "ncap")), class = "data.frame", 
 row.names = c(NA, -6L))
相关问题