如何使用R在具有隐藏标签的页面上进行网页抓取?

时间:2019-11-23 21:03:23

标签: r web-scraping scroll rvest rselenium

我正在使用R的r-vest包进行Web抓取,但是当它捕获数据时,它仅使用前几个元素,读取前18个元素,实际上是410。 我想知道我需要哪个附加组件才能滚动并阅读所有内容。

library(rvest)

# Specify the url of the page from which we want to extract the information
url <- "https://www.tiendasjumbo.co/supermercado/bebidas/gaseosas"

# Reading the HTML code of the page 
gaseosas <- read_html(url)

# Product names
titulos <- html_nodes(gaseosas, ".product-item__brand")

# Converting to text
gaseosa <- html_text(nodos_titulos)

0 个答案:

没有答案