为什么在数据帧列表上使用管道和映射失败?

时间:2019-06-01 11:38:50

标签: r purrr rowwise

我也将小标题嵌套在带有标识符列的列表中。我想在每个嵌套的小标题上运行匿名函数。但是,当我使用管道来引用我的主df,然后再引用包含我的数据映射的列表时,则不起作用。

# Creating the df
df_nested <- iris %>% group_by(Species) %>% nest()

# Does not work
# df_nested %>% 
# map(data, nrow)

# Works
map(df_nested$data, nrow)

我想了解为什么代码不能使用管道。

2 个答案:

答案 0 :(得分:2)

这是因为在使用管道(%>%)时,默认情况下会从LHS传递第一个参数。

做事时

df_nested %>% map(data, nrow)

你得到

#$Species
#[1] ".x[[i]]" "nrow"   

#$data
#[1] ".x[[i]]" "nrow"   

#Warning messages:
#1: In .f(.x[[i]], ...) : data set ‘.x[[i]]’ not found
#2: In .f(.x[[i]], ...) : data set ‘nrow’ not found
#3: In .f(.x[[i]], ...) : data set ‘.x[[i]]’ not found
#4: In .f(.x[[i]], ...) : data set ‘nrow’ not found

相同
map(df_nested, data, nrow)

如果要使用管道,则可能需要

df_nested$data %>% map(nrow)

#[[1]]
#[1] 50

#[[2]]
#[1] 50

#[[3]]
#[1] 50

答案 1 :(得分:2)

使用mutate数据时最好使用nested

df_nested %>% 
   mutate(Nrow=map(data,nrow)) %>% 
   unnest(Nrow)
# A tibble: 3 x 3
  Species    data               Nrow
  <fct>      <list>            <int>
1 setosa     <tibble [50 x 4]>    50
2 versicolor <tibble [50 x 4]>    50
3 virginica  <tibble [50 x 4]>    50