在选择页面结果后,当url没有改变时使用R进行Web抓取

时间:2015-11-12 04:41:25

标签: xml r url web-scraping

我想从此页面中删除所有产品价格:

http://www.la14.com/Tiendala14/paginacion/numericpaging.aspx?Catalog=base_catalog&Category=Mercado%2fAseo+Hogar

我可以在此网址的右下角看到它有很多页面。例如,如果我选择页码6,则URL不会更改。

我在R中运行下一个代码以获取所有价格:

library(RCurl)
library(XML)
library(xml2)
doc <- read_html('http://www.la14.com/Tiendala14/paginacion/numericpaging.aspx?Catalog=base_catalog&Category=Mercado%2fAseo+Hogar')

prices <- xml_find_all(doc, xpath="//span[@id=]")

但我只是从这个网址中的第1页获得产品价格。如何从此网址的其余页面获取产品价格?

0 个答案:

没有答案