在数据框中的几个列表列之一

时间:2018-01-31 09:17:09

标签: r tidyr

我有几个列表列,我只想取消其中一个列表。

示例

library(dplyr)
library(purrr)
library(tidyr)
library(stringr)

iris %>% 
  group_by(Species) %>% 
  nest() %>% 
  mutate(sum_data = map(data,
                        ~.x %>% 
                          summarize_all(mean) %>% 
                          rename_all(funs(str_c("Mean.", .))))) 

# A tibble: 3 x 3
#      Species              data         sum_data
#       <fctr>            <list>           <list>
# 1     setosa <tibble [50 x 4]> <tibble [1 x 4]>
# 2 versicolor <tibble [50 x 4]> <tibble [1 x 4]>
# 3  virginica <tibble [50 x 4]> <tibble [1 x 4]>

现在我想保留嵌套的data列,但是不需要sum_data列,没有明确指定sum_data中的每个列名,也没有取消整个数据集,然后重新排除数据栏。

期望的结果

# A tibble: 3 x 6
#      Species              data Mean.Sepal.Length Mean.Sepal.Width Mean.Petal.Length Mean.Petal.Width
#       <fctr>            <list>             <dbl>            <dbl>             <dbl>            <dbl>
# 1     setosa <tibble [50 x 4]>             5.006            3.428             1.462            0.246
# 2 versicolor <tibble [50 x 4]>             5.936            2.770             4.260            1.326
# 3  virginica <tibble [50 x 4]>             6.588            2.974             5.552            2.026

1 个答案:

答案 0 :(得分:2)

根据unnest,参数...

  

嵌套列的规范。使用裸变量名称或   变量的功能。如果省略,则默认为所有list-cols。

因此,我们可以在unnest

之后指定列名为rename_all
iris %>
  ... #op's code
  ...

  rename_all(funs(str_c("Mean.", .))))) %>%
  unnest(sum_data)
# A tibble: 3 x 6
#  Species    data              Mean.Sepal.Length Mean.Sepal.Width Mean.Petal.Length Mean.Petal.Width
#  <fctr>     <list>                        <dbl>            <dbl>             <dbl>            <dbl>
#1 setosa     <tibble [50 x 4]>              5.01             3.43              1.46            0.246
#2 versicolor <tibble [50 x 4]>              5.94             2.77              4.26            1.33 
#3 virginica  <tibble [50 x 4]>              6.59             2.97              5.55            2.03