用多个变量重新编码相同的因子水平值"用mutate_at"在Tidyverse

时间:2018-02-28 08:32:01

标签: r dplyr tidyverse forcats

我有几个因子变量值#34; 1"和" 2"需要重新编码为"是"和"不"。使用 fct_recode 的Tidyverse mutate_at 似乎是正确的工具。但是,

dataframe %>%
 mutate_at(vars (var1, var9, var17) =
              fct_recode(vars(var1, var9, var17), 
                         "Yes" = "1",
                         "No" = "2"))

给出

Error: unexpected ')' in:
"                         "Yes" = "1",
                         "No" = "2"))"

而且,

dataframe %>%
 mutate_at(vars (var1, var9, var17), 
              funs(fct_recode(vars(var1, var9, var17), 
                         "Yes" = "1",
                         "No" = "2")))

给出

Error: `f` must be a factor (or character vector).

有人指出我的错误还是使用 mutate_at vars fct_recode 错了?在tidyverse中有更好的方法可以在多个变量上重新编码相同的因子水平,这是整理数据的一个非常常见的任务。

1 个答案:

答案 0 :(得分:6)

问题在于mutate_at()中的语法。

library(dplyr)

首先,我创建一个样本数据集:

set.seed(666)
dataframe <- data.frame(var1 = sample(c("1", "2"), 5, replace = TRUE),
                        var9 = sample(c("1", "2"), 5, replace = TRUE),
                        var17 = sample(c("1", "2"), 5, replace = TRUE))

  var1 var9 var17
1    2    2     2
2    1    2     1
3    2    1     1
4    1    1     1
5    1    1     1

然后我使用mutate_at()这样:.vars不变,但.funs只是函数,funs的附加参数在...中传递:

dataframe %>% 
  mutate_at(.vars = vars(var1, var9, var17),
            .funs = forcats::fct_recode,
            "Yes" = "1",
            "No" = "2")

最终结果:

  var1 var9 var17
1   No   No    No
2  Yes   No   Yes
3   No  Yes   Yes
4  Yes  Yes   Yes
5  Yes  Yes   Yes