我昨天发布了有关此问题的信息,但对实际问题有误。
我有一个网页,其中包含从远程站点收集的所有数据,我必须定期物理上访问该站点以下载.csv格式的数据。基本上,网站的建立方式只是一个“下载”按钮。但是,当我检查按钮时,它只会带回用于按钮的图像。我检查了页面,发现该按钮触发了一个函数,该函数生成一个.csv。因此,按钮后没有物理文件。我的问题是,是否可以导航到该按钮,然后单击它来生成此文件并通过R下载。
我尝试通过简单地单击下载按钮,然后转到Chrome上的下载以查找与文件关联的URL来下载数据。该URL在R中的download.file()
中工作了很短的时间,但是一旦将新数据上载到服务器(每15分钟),则什么也没有发生。我尝试使用以下代码找到href
属性,但收到错误消息。
realtime.page = read_html("https://stormcentral.waterlog.com/SiteDetails.php?a=263&site=2267")
realtime.page %>%
html_nodes("a") %>%
html_attr("href") %>%
str_subset("\\.csv") %>%
.[[1]]
代码中的URL受密码保护,因此很难提供可复制的示例。但是当它运行时,我得到Error in .[[1]] : subscript out of bounds