从URL中检索文件列表

时间:2012-10-17 09:15:41

标签: r

我想获得此地址所有可用文件的列表:http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/ (来自NOAA的公开数据)。

对于特定的URL,它将是某种“list.files”。 我开始看看RCurl,但我能得到的只是URL的HTML代码。

1 个答案:

答案 0 :(得分:4)

在这种情况下,您只需使用readHTMLTable

即可
readHTMLTable("http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/", 
              skip.rows=1:2)[[1]]$Name -> file.list

然后创建路径列表:

paste("http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/", 
      file.list[!is.na(file.list)], sep="") -> path.list