使用purrr迭代数据框中的几个(但不是全部)列

时间:2018-01-07 01:37:46

标签: r dataframe dplyr tidyverse purrr

我正在寻找一种简洁的方法,在整齐的管道内同时处理多个柱子。 问题是我不需要使用所有列:只有几个。

library(tidyverse)
mtcars <- mtcars %>% rownames_to_column(var = 'car')
str(mtcars)

'data.frame':   32 obs. of  12 variables:
 $ car : chr  "Mazda RX4" "Mazda RX4 Wag" "Datsun 710" "Hornet 4 Drive" ...
 $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
 $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
 $ disp: num  160 160 108 258 360 ...
 $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec: num  16.5 17 18.6 19.4 17 ...
 $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

想象一下,我想对列dratqsecgear执行一些操作。 (例如,转换为字符。谁知道原因)

如果不写动作3次,怎么办呢?也许使用purrr()

4 个答案:

答案 0 :(得分:2)

在dplyr中尝试mutate_at

mtcars %>% mutate_at(c("drat", "qsec", "gear"), as.character)

它也可以这样写:

mtcars %>% mutate_at(vars(drat, qsec, gear), as.character)

答案 1 :(得分:2)

基础R解决方案。我们可以使用lapply遍历列名并设计一个函数来将目标列转换为字符。

mtcars[] <- lapply(colnames(mtcars),
                    function(x) {
                      y <- mtcars[[x]]
                      if (x %in% c("drat", "qsec", "gear")){
                        y <- as.character(y)
                      }
                      return(y)
                    })

str(mtcars)
# 'data.frame': 32 obs. of  12 variables:
#   $ car : chr  "Mazda RX4" "Mazda RX4 Wag" "Datsun 710" "Hornet 4 Drive" ...
# $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
# $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
# $ disp: num  160 160 108 258 360 ...
# $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
# $ drat: chr  "3.9" "3.9" "3.85" "3.08" ...
# $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
# $ qsec: chr  "16.46" "17.02" "18.61" "19.44" ...
# $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
# $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
# $ gear: chr  "4" "4" "4" "3" ...
# $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

答案 2 :(得分:1)

此处的2个关键功能是map_at(或map_if,如果不是知道列,我们对列有所了解但不知道我们需要哪些列,而map_df (返回数据框而不是列表)。

不幸的是,我看不到兼具两者的功能。但我们可以解决它。通过map_df查看,这是一个常规map,最后添加了bind_rows()

这就是我们所需要的:

mtcars2 <- mtcars %>% 
  map_at(c('drat', 'qsec', 'gear'), as.character) %>% 
  bind_rows()

答案 3 :(得分:1)

您还可以使用modify中的modify_atpurrrmodify函数类似map,但输出的格式与输入相同。

modify_at将与@ g-grothendieck解决方案中mutate_at的使用方式相同:

mtcars %>% modify_at(c("drat", "qsec", "gear"), as.character)

如果你使用magrittr,你也可以这样做(这个覆盖mtcars):

mtcars[, c("drat", "qsec", "gear")] %<>% modify(as.character)