RSelenium:刮掉一个完整的可扩展表

时间:2018-07-16 00:29:34

标签: r web-scraping rvest rselenium

基于this问题,OP希望从此page刮下“ All Holdings”表-向下滚动至黄色部分。该表显示了前10行,但可以扩展到更多行。

当我们需要整个表格时,我的rvestRSelenium解决方案都只占用前10行。我的代码:

最佳代码

library(tidyverse)
library(rvest)

etf_url <- "http://innovatoretfs.com/etf/?ticker=ffty"

etf_table <- etf_url %>%
  read_html %>%
  html_table(fill = T) %>% 
  .[[5]]

硒编号

library(RSelenium)
library(rvest)

remDr <- remoteDriver(port = 4445L, remoteServerAddr = "localhost",
                  browserName = "chrome")
remDr$open()
remDr$navigate("http://innovatoretfs.com/etf/?ticker=ffty")
page <- read_html(remDr$getPageSource()[[1]])
table <- html_table(page, fill = TRUE, header = T)
table[[5]]

如何获取FULL表?谢谢。

1 个答案:

答案 0 :(得分:1)

以下应扩展表-并未在Selenium中对其进行测试,但它应该可以工作。

remDr$executeScript("__doPostBack('ctl00$BodyPlaceHolder$ViewHoldingsLinkButton','')", args = list())