循环以等待r中的结果或超时

时间:2017-02-03 23:38:18

标签: r connection-timeout rvest blast

我在r中编写了一个非常快速的blast脚本,以便与NCBI blast API连接。但有时,结果url需要一段时间才能加载,我的脚本会抛出错误,直到url准备就绪。是否有一种优雅的方式(即tryCatch选项)来处理错误,直到返回结果或在指定时间后超时?

  library(rvest)
  ## Definitive set of blast API instructions can be found here: https://www.ncbi.nlm.nih.gov/staff/tao/URLAPI/new/BLAST_URLAPI.html
  ## Generate query URL
  query_url <-
    function(QUERY,
             PROGRAM = "blastp", 
             DATABASE = "nr",
             ...) {
      put_url_stem <-
        'https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Put'
      arguments = list(...)
      paste0(
        put_url_stem,
        "&QUERY=",
        QUERY,
        "&PROGRAM=",
        PROGRAM,
        "&DATABASE=",
        DATABASE,
        arguments
      )
    }

  blast_url <- query_url(QUERY = "NP_001117.2")      ## test query
  blast_session <- html_session(blast_url)               ## create session
  blast_form <- html_form(blast_session)[[1]]         ## pull form from session
  RID <- blast_form$fields$RID$value      ## extract RID identifier

  get_url <- function(RID, ...) {
    get_url_stem <-
      "https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Get"
    arguments = list(...)
    paste0(get_url_stem, "&RID=", RID, "&FORMAT_TYPE=XML", arguments)
  }
  hits_xml <- read_xml(get_url(RID))    ## this is the sticky part 

get_url有时需要几分钟的时间才能上线,所以我想要的是继续尝试让我们每20-30秒说一次,直到它产生网址或超时在预先指定的时间之后。

1 个答案:

答案 0 :(得分:1)

我想你可能会找到this answer about the use of tryCatch useful

关于'继续尝试直到超时'部分。我想你可以在this other answer about a tryCatch loop on error

之上工作

希望它有所帮助。