有没有一种方法可以根据Date html节点有条件地对数据进行爬网?

时间:2019-01-22 20:40:47

标签: r web-scraping rvest

我是R的新手,我有一个网址可以定期抓取数据。例如,数据是从头开始刮取的,直到现在为止,如果我必须在下个月刮刮数据,我是否可以有条件地设置代码,以便仅从这些日期开始刮刮数据,而不是从头开始刮刮所有内容? / p>

这是我的原始代码:

url<-"https://www.dealerrater.com/dealer/Fox-Volkswagen-of-Rochester-Hills-review-5380/page1/?filter=ALL_REVIEWS"
review <- read_html(url)
dates <- cbind(review %>% html_nodes("div.italic.col-xs-6.col-sm-12.pad-none.margin-none.font-20") %>%     html_text()     )
reviews <- cbind(review %>% html_nodes("div.tr.margin-top-md") %>%     html_text()     )
x <- cbind(dates,reviews)

基于dates html节点,是否可以仅刮擦那些日期的评论?我不知道该怎么办。

任何帮助或建议将不胜感激!!预先谢谢你。

0 个答案:

没有答案