R管道链错误处理中的tryCatch()或exists()

时间:2017-10-03 02:42:24

标签: r dplyr try-catch magrittr

我正在经历一个打嗝,我试图从一些上游计算中创建一个值表。通常,我一直假设每次创建这些数据帧时至少有一个值为1;但是我遇到了一个不是这种情况的例子,结果是一个看起来像这样的表:

df <- data.frame(
  Experiment_Batch = c(rep("008_1", 83),
                       rep("008_6", 82),
                       rep("520_0", 2),
                       rep("944_10", 84),
                       rep("944_8", 85),
                       rep("944_9", 72)),
  Overall = rep(0, 408)
  ) 

这导致了以下下游处理:

df %>% 
  dplyr::count(Experiment_Batch, Overall) %>%
  tidyr::spread(Overall, n, fill = 0) %>% 
  dplyr::select(Experiment_Batch, `1`)

错误输出:Error in overscope_eval_next(overscope, expr) : object '1' not found

我尝试过使用tryCatch()exists(),但我似乎无法让这些工作正常。理想情况下,这将使用管道运算符优雅地处理。我已经知道我可以创建一个对象并在我的工作流程中添加一些if-else语句,但是我想知道是否有......“更有趣”的方式来处理这个问题,所以我不会必须打破工作。

1 个答案:

答案 0 :(得分:3)

如果要在列不存在时忽略选择,可以使用select辅助函数;此处matches("^1$")将尝试选择名称与1完全匹配的列,因为数据框没有列,它只是忽略选择,因为matches返回integer(0)

library(tidyverse)
df %>% 
    count(Experiment_Batch, Overall) %>%
    spread(Overall, n, fill = 0) %>% 
    select(Experiment_Batch, matches("^1$"))

# A tibble: 6 x 1
#  Experiment_Batch
#*           <fctr>
#1            008_1
#2            008_6
#3            520_0
#4           944_10
#5            944_8
#6            944_9
当非列名称与matches中忽略的模式匹配时,

integer(0)会返回select

matches("^1$", vars = c("0", "experiment"))
# integer(0)

matches("^1$", vars = c("0", "experiment", "1"))
# [1] 3

如果您需要自定义错误捕获:

library(tidyverse)
df %>% 
    count(Experiment_Batch, Overall) %>%
    spread(Overall, n, fill = 0) %>% 
    {
        tryCatch(
            select(., Experiment_Batch, `1`), 
            error=function(e) select(., Experiment_Batch)
        )
    }
    # replace the error with the customized function to handle the exception

# A tibble: 6 x 1
#  Experiment_Batch
#*           <fctr>
#1            008_1
#2            008_6
#3            520_0
#4           944_10
#5            944_8
6            944_9