Question

这是我的数据：

vec1 <- c("A", "B")
vec2 <- c("A", "B", "C")

df1 <- structure(list(A = c("X", "Y"), data = list(structure(list(B = c(4L, 9L)), .Names = "B", row.names = c(NA, -2L), class = c("tbl_df", "tbl", "data.frame")), structure(list(B = c(5L, 2L, 8L, 2L)), .Names = "B", row.names = c(NA, -4L), class = c("tbl_df", "tbl", "data.frame"))), C = list(c("A", "B"), c("A", "B", "C"))), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -2L), .Names = c("A", "data", "C"))

这是我的代码：

df2 <- df1 %>% mutate(data = map2(data, C, ~ if(identical(.y, vec1)) filter(.x, B < 5) else filter(.x, B > 4)))

为了方便地扩展条件数，我想将上面代码中的if else结构转换为case_when构造。我怎样才能做到这一点？

Answer 1

为什么需要case when？

尝试：

m=df1%>%
  mutate(filt=map2(data,match(C,list(vec1,vec2)),
               ~filter_(.x,c("B<=4","B>4")[.y])))

   m
# A tibble: 2 x 4
  A     data             C         filt            
  <chr> <list>           <list>    <list>          
1 X     <tibble [2 x 1]> <chr [2]> <tibble [1 x 1]>
2 Y     <tibble [4 x 1]> <chr [3]> <tibble [2 x 1]>

如果您希望它与df2完全相同，只需替换data列：

df1%>%
      mutate(data=map2(data,match(C,list(vec1,vec2)),
                   ~filter_(.x,c("B<=4","B>4")[.y])))%>%
      identical(df2)
 [1] TRUE

如果条件太多，您可以在外面创建它们。条件的排序很重要：顺序或条件应与向量的顺序相匹配，例如：

   conditions=c("B>4","B<=4")
   ll=list(vec2,vec1)
   df1%>%
      mutate(data=map2(data,match(C,ll),
                   ~filter_(.x,conditions[.y])))%>%
      identical(df2)
     [1] TRUE

Answer 2

不幸的是，在这种情况下，我不知道你是否可以使用case_when。文档声明它返回一个向量并进行检查以确保所有元素都是相同的类型（根据R中的向量的要求）。这与基础ifelse相反，例如，它将强制转换为角色。由于您返回的是列表而不是向量，因此所有元素都是不同的类型，case_when将不起作用。如果您有许多不同的if以及需要处理的关联操作，则可能需要指定较长的else if vec链。

然后使用purrr map2将if转换为嵌套数据中的case_when

2 个答案: