使用默认名称的R下载文件

时间:2018-02-15 10:04:46

标签: r regex curl https download

我想下载一些文件,但是我想用它们的默认名称保存它们,也就是说,当通过浏览器打开url时出现的名称。我在python here中找到了同一个问题的一个线程,但没有找到R

这是我目前的代码,它以特定格式下载日本47个州的劳动力供应:

n = 47
str1 = "https://www.e-stat.go.jp/en/stat-search/file-download?statInfId=00003164"
str2.1 = seq(from =3894, by=15,length.out=24)
str2.2 = seq(from =4259, by=15,length.out=23)
str2 = c(str2.1, str2.2)
str3 = "&fileKind=1"
destfiles  = c(paste0("010_0",1:9,".csv"),paste0("010_",10:n,".csv"))
url = paste0(str1,str2,str3)
mapply(download.file, url, destfile=destfiles, method='curl')

请注意我如何使用序列函数创建文件编号。理想情况下,每个第15个文件都是我需要的文件,因为每个州有15个与之相关的文件,但在中间的某个地方,它们包含一些额外的文件和文件编号。更改。如果我自己提供目标文件名,我不会通过查看其名称来了解我是否下载了正确的文件。但如果我能以某种方式得到默认名称,我会立即通过查看其名称来了解我是否下载了不正确的文件。名称格式为" 010_xx.csv" ,其中 xx 是文件编号。

要查看默认名称,您可以通过代码或通过以下链接获取url[[1]]url[[2]]url1url2并使用浏览器打开它们。

0 个答案:

没有答案