每天在R中存储Web抓取的数据以及日期

时间:2018-09-19 20:56:22

标签: r dataframe web-scraping automation

我正在尝试从zappos.com上抓取一些数据。我想每天都在同一时间抓取数据,并将所有这些数据保存在一个数据帧或文件中。我该怎么办?

截至目前,我当前的数据库如下所示。我只希望代码每天同时运行,并继续向该数据帧添加行。enter image description here

这是我的代码(部分代码):

webpage2 <- read_html("https://www.zappos.com/adidas- 
shoes/CK_XAVoBAeABAeICAwELHA.zso")
adidas_sale_count_html <- html_nodes(webpage2, '.selectedFacet 
._2TdLt')
adidas_sale_count <- html_text(adidas_sale_count_html)
adidas_sale_count <- as.character(adidas_sale_count)
adidas_sale_count <- gsub("[()]","", adidas_sale_count)
head(adidas_sale_count)

shoes <- data.frame(Date = Sys.Date(),Originals_on_Sale = 
adiori_sale_count, Originals_Total = adiori_total_count, Adidas_on_Sale 
= adidas_sale_count, Adidas_Total = adidas_total_count)

任何帮助将不胜感激。谢谢

0 个答案:

没有答案