与网页交互以使用R下载数据

时间:2019-09-12 16:46:35

标签: html r rcurl

我昨天发布了有关此问题的信息,但对实际问题有误。

我有一个网页,其中包含从远程站点收集的所有数据,我必须定期物理上访问该站点以下载.csv格式的数据。基本上,网站的建立方式只是一个“下载”按钮。但是,当我检查按钮时,它只会带回用于按钮的图像。我检查了页面,发现该按钮触发了一个函数,该函数生成一个.csv。因此,按钮后没有物理文件。我的问题是,是否可以导航到该按钮,然后单击它来生成此文件并通过R下载。

我尝试通过简单地单击下载按钮,然后转到Chrome上的下载以查找与文件关联的URL来下载数据。该URL在R中的download.file()中工作了很短的时间,但是一旦将新数据上载到服务器(每15分钟),则什么也没有发生。我尝试使用以下代码找到href属性,但收到错误消息。

realtime.page = read_html("https://stormcentral.waterlog.com/SiteDetails.php?a=263&site=2267")

realtime.page %>%
  html_nodes("a") %>%       
  html_attr("href") %>%     
  str_subset("\\.csv") %>%
  .[[1]]

代码中的URL受密码保护,因此很难提供可复制的示例。但是当它运行时,我得到Error in .[[1]] : subscript out of bounds

0 个答案:

没有答案