我是RSelenium的新手,我正在寻找创建一个循环以循环并从多个网页中刮擦同一张表。
我可以使用以下代码抓取一年-这是2019/2020年的今年数据
library("dplyr")
library("RSelenium")
library("rvest")
url <- "https://www.betexplorer.com/soccer/germany/bundesliga/results/"
rD1 <- rsDriver(port=4776L, browser = "chrome", geckover = NULL, chromever = "81.0.4044.138", iedrver = NULL, phantomver = NULL)
remDr <- rD1$client
remDr$navigate(url)
page <- remDr$getPageSource()
table <- page[[1]] %>%
read_html() %>%
html_nodes(xpath = '/html/body/div[3]/div[4]/div/div/div[1]/section/div[2]/div/table')%>%
html_table(fill = T)
table <- table[[1]]
我可以请求RSelenium通过使用以下方式为我查找2018/2019年的数据
selectElem <- remDr$findElement("xpath", paste0("/html/body/div[3]/div[4]/div/div/div[1]/section/header/div/div"))
selectElem$clickElement()
selectElem2 <- remDr$findElement("xpath", paste0("/html/body/div[3]/div[4]/div/div/div[1]/section/header/div/div/ul/li[3]"))
selectElem2$clickElement()
selectElem3 <- remDr$findElement("xpath", paste0("/html/body/div[4]/div[4]/div/div/div[1]/section/div[1]/div/ul/li[2]"))
selectElem3$clickElement()
但是我不确定如何创建一个循环来同时从这两个页面或多个页面中抓取数据。