我想要一个网址的所有可用地址/网页。例如,从这些开始:
url <- "http://www.rstudio.com/"
url <- "http://www.rstudio.com/resources/"
如何获得所有下游位的列表,即
http://www.rstudio.com/*
或http://www.rstudio.com/resources/*
。
我尝试过(使用library(RCurl)
):
getURL(url, ftp.use.epsv = FALSE, ftplistonly = TRUE, crlf = TRUE)
适用于ftp网站,但不适用于http。请帮忙。