我正在抓取数据,我想知道如何编写一个等同于purrr
的{{1}}行来保留所有链接到rar或xlsx文件的字符串。
这有效:
grep
然而,有没有办法将x <- read_html("http://datos.gob.cl/dataset/registros-de-exportacion-2009") %>%
html_nodes("a") %>%
html_attr("href") %>%
grep(paste(c("\\.rar", "\\.xlsx"), collapse = "|"), ., value = T)
写为grep(...)
以便更简单的写作?