R骑自行车浏览网站上的所有网页

时间:2014-08-07 18:28:03

标签: html r loops

我正在努力解决网络诈骗问题。我试图在零售商网站上浏览所有网页,试图撤回商品代码,产品描述和价格。到目前为止,我有这个代码

> fileUrl <- "http://www.boots.com/en/LOreal-Paris-Revitalift-Laser-Renew-Peeling-Lotion-Night_1493102/"
> doc <- htmlTreeParse(fileUrl,useInternal=TRUE)
> codes <- xpathSApply(doc,"//p[@class='itemNumber']",xmlValue)
> desc <- xpathSApply(doc,"//span[@itemprop='name']",xmlValue)
> price <- xpathSApply(doc,"//span[@itemprop='price']",xmlValue)

我对R很缺乏经验,这五行显示了我帝国的大小。

此代码确实撤回了所需信息,但每个产品都有自己的页面,并且有数千种产品。

我需要的是一种循环浏览网站上每个网页并将这些信息汇集到一个地方的方法。

0 个答案:

没有答案