我尝试使用rvest从本网站提取“VAI ALLA SCHEDA PRODOTTO”的链接:
https://www.asusworld.it/series.asp?m=Notebook#db_p=2
我的R代码:
library(rvest)
page.source <- read_html("https://www.asusworld.it/series.asp?m=Notebook#db_p=2")
version.block <- html_nodes(page.source, "a") %>% html_attr("href")
但是,我无法获得任何类似“/model.asp?p=2340487”的链接。我该怎么办?
答案 0 :(得分:0)
您可以使用RSelenium从网站上请求预期信息。
加载相关的包。 (请确保R包'wdman'是最新的。)
library("RSelenium")
library("wdman")
Initialize R Selenium服务器(我使用Firefox - 推荐)。
rD <- rsDriver(browser = "firefox", port = 4850L)
rd <- rD$client
Navigate到网址(并设置适当的等待时间)。
rd$navigate("https://www.asusworld.it/series.asp?m=Notebook#db_p=2")
Sys.sleep(5)
请求预期信息(例如,您可以参考元素的“xpath”。
element <- rd$findElement(using = 'xpath', "//*[@id='series']/div[2]/div[2]/div/div/div[2]/table/tbody/tr/td/div/a/div[2]")
显示请求的元素(即信息)。
element$getElementText()
[[1]]
[1] "VAI ALLA SCHEDA PRODOTTO"