将html链接转换为r中的目标

时间:2017-10-13 05:53:38

标签: r curl web-scraping rvest

我试图使用r从ABS.gov.au中抓取数据,但每个链接,而不是指向文件都有这种格式:

http://abs.gov.au/ausstats/meisubs.NSF/log?openagent&640101.xls&6401.0&Time Series Spreadsheet&401EDAE91BAF3EB6CA2581680012D506&0&Jun 2017&26.07.2017&Latest

无论如何使用r(可能卷曲)下载位于上面链接后面的文件?

1 个答案:

答案 0 :(得分:0)

如果你的目标只是下载文件,那么就是这样做的。

url = "http://abs.gov.au/ausstats/meisubs.NSF/log?openagent&640101.xls&6401.0&Time Series Spreadsheet&401EDAE91BAF3EB6CA2581680012D506&0&Jun 2017&26.07.2017&Latest"
dest = 'downloaded_file.xls'

download.file(url,dest)