如何计算列表列中的向量长度(嵌套)

时间:2018-04-05 06:17:38

标签: r dplyr tidyverse

我有以下代码

library(tidyverse)
dat <- iris %>% 
    group_by(Species) %>% 
    summarise(summary = list(fivenum(Petal.Width))) 

dat
#> # A tibble: 3 x 2
#>   Species    summary  
#>   <fct>      <list>   
#> 1 setosa     <dbl [5]>
#> 2 versicolor <dbl [5]>
#> 3 virginica  <dbl [5]>

基本上我使用了Iris数据,按物种分组,然后计算fivenum()

我想要做的是简单地计算汇总值的长度:  这就是我所尝试的但它没有产生我期望的东西:

dat %>% 
  mutate(nof_value = length(summary))

# A tibble: 3 x 3
#  Species    summary   nof_values
#  <fct>      <list>         <int>
#1 setosa     <dbl [5]>          3
#2 versicolor <dbl [5]>          3
#3 virginica  <dbl [5]>          3

nof_values应该都等于5.什么是正确的方法呢?

2 个答案:

答案 0 :(得分:7)

我们可以使用lengths来计算嵌套列表的长度

library(tidyverse)
dat %>%
   mutate(nof_values = lengths(summary))

#  Species    summary   nof_values
#  <fct>      <list>         <int>
#1 setosa     <dbl [5]>          5
#2 versicolor <dbl [5]>          5
#3 virginica  <dbl [5]>          5

其基数为R的等价物

dat$nof_values <- lengths(dat$summary)

旁注:lengthlengths

不同
length(dat$summary)
#[1] 3

lengths(dat$summary)
#[1] 5 5 5

答案 1 :(得分:2)

你可以使用purrr包中的map_int命令(这是tidyverse的一部分)

dat <- iris %>% 
  group_by(Species) %>% 
  summarise(summary = list(fivenum(Petal.Width))) %>% 
  mutate(nof_value = map_int(summary, length))