使用R从ftp-server下载最新文件

时间:2014-03-06 20:38:01

标签: r ftp download

我有一些名为

的文件
FileA2014-03-05-10-24-12
FileB2014-03-06-10-25-12

“2014-03-05-10-24-12”部分的意思是“年/日/月/小时/分钟/秒/”。这些文件驻留在ftp服务器上。我想使用R连接到ftp-server并根据日期下载最新的文件。

我已经开始尝试使用RCurl和dirlistonly列出内容。下一步将尝试解析并找到最新的文件。还没到那儿......

library(RCurl)
getURL("ftpserver/",verbose=TRUE,dirlistonly = TRUE) 

1 个答案:

答案 0 :(得分:28)

这应该有效

library(RCurl)
url <- "ftp://yourServer"
userpwd <- "yourUser:yourPass"
filenames <- getURL(url, userpwd = userpwd,
             ftp.use.epsv = FALSE,dirlistonly = TRUE) 

-

times<-lapply(strsplit(filenames,"[-.]"),function(x){
  time<-paste(c(substr(x[1], nchar(x[1])-3, nchar(x[1])),x[2:6]),
        collapse="-")
  time<-as.POSIXct(time, "%Y-%m-%d-%H-%M-%S", tz="GMT")
})
ind <- which.max(times)
dat <- try(getURL(paste(url,filenames[ind],sep=""), userpwd = userpwd))

所以dat现在包含最新的文件

要使其可重现:所有其他人都可以使用此代替上部使用

filenames<-c("FileA2014-03-05-10-24-12.csv","FileB2014-03-06-10-25-12.csv")