Question

我正在试图抓一个网站，但它没有给我任何数据。

xpath = '//*[contains(concat( " ", @class, " " ), concat( " ", "green", " " ))]//div[(((count(preceding-sibling::*) + 1) = 1) and parent::*)]//a'

我也试过使用{{1}}，但这给了我与0数据相同的结果。

我期待着马的名字。即使页面上的数据是由javascript呈现的，我也不应该得到一些javascript代码吗？

我无法在这里看到我应该使用的其他CSS选择器。

Answer 1

您可以简单地使用RSelenium软件包来抓取动态网页：

library(RSelenium)
#specify the url
url <- 'https://www.travsport.se/sresultat?kommando=tevlingsdagVisa&tevdagId=570243&loppId=0&valdManad&valdLoppnr&source=S'

#Create the remote driver / navigator
rsd <- rsDriver(browser = "chrome")
remDr <- rsd$client

#Go to your url
remDr$navigate(url)
page <- read_html(remDr$getPageSource()[[1]])

#get your horses data by parsing Selenium page with Rvest as you know to do
page %>% html_nodes(".green div:nth-child(1)") %>% html_text()

希望这会有所帮助

Gottavianoni

用rvest抓取时没有数据

1 个答案: