无法从包含多个网页的网站检索数据

时间:2017-02-13 19:55:53

标签: r web-scraping rvest

对于我面临的问题,我真的可以使用一些帮助。我有一个项目,我应该取一些产品的名称和价格。我必须从给定类别的前5页中检索数据。我试图使用R,rvest包和SelectorGadget扩展来实现它,以选择适当的css选择器。我已经写了一个函数来做到这一点:

readDataProject2<-function(){
  url<-readline(prompt="Enter url: ")
  nameTags<-readline(prompt="Enter name tags: ")
  priceTags<-readline(prompt="Enter price tags: ")
  itemNames<-read_html(url)%>%html_nodes(nameTags)%>%html_text()
  itemPrices<-read_html(url)%>%html_nodes(priceTags)%>%html_text()
  itemPrices<-itemPrices[-c(1,2)]
  page<-cbind(itemNames,itemPrices)

}

此处是anesishome.gr页面。从这个特定的页面,我可以去下一个等,以获取总共... 240个产品。但即使我提供下一页的网址second page,我仍然会收到第一页的数据。毋庸置疑,选择在一个页面中显示240的选项并没有任何好处。任何人都可以指出我做错了吗?

0 个答案:

没有答案