使用CSS选择器在R中进行网页爬取

时间:2018-09-18 15:46:50

标签: r web-scraping rvest

我正在尝试从鞋类网站footfooter.com上抓取一些数据 我有以下代码,在这里我尝试提取正在销售的“ xyz”品牌鞋子的数量以及这些鞋子的总数。

library(rvest)
webpage <- 
read_html("https://www.footlocker.com/category/brands/adidas.html? 
query=adidas%3Arelevance%3AproductType%3A200005")
webpage

#Using CSS selectors to scrape the sale section
sale_count_html <- html_nodes(webpage, 'li:nth-child(1) .miscellaneous 
.count')
sale_count <- html_text(sale_count_html)
sale_count <- as.numeric(sale_count)
head(sale_count)


total_count_html <- html_nodes(webpage,'strong+ strong')
total_count <- html_text(total_count_html)
head(total_count)

它给我sale_count的字符(0),而在网站上是3位数字。对于total_count,它给我的数字与网站上的数字完全不同

0 个答案:

没有答案