我是R的新手,我有一个网址可以定期抓取数据。例如,数据是从头开始刮取的,直到现在为止,如果我必须在下个月刮刮数据,我是否可以有条件地设置代码,以便仅从这些日期开始刮刮数据,而不是从头开始刮刮所有内容? / p>
这是我的原始代码:
url<-"https://www.dealerrater.com/dealer/Fox-Volkswagen-of-Rochester-Hills-review-5380/page1/?filter=ALL_REVIEWS"
review <- read_html(url)
dates <- cbind(review %>% html_nodes("div.italic.col-xs-6.col-sm-12.pad-none.margin-none.font-20") %>% html_text() )
reviews <- cbind(review %>% html_nodes("div.tr.margin-top-md") %>% html_text() )
x <- cbind(dates,reviews)
基于dates html节点,是否可以仅刮擦那些日期的评论?我不知道该怎么办。
任何帮助或建议将不胜感激!!预先谢谢你。