使用Rvest和Selector小工具进行故障排除(新程序员需要帮助)

时间:2019-09-27 02:29:55

标签: html web-scraping css-selectors rvest

我正在尝试学习尽可能多的互联网知识,但是到处都是试图弄清楚这一点。我正在与rvest和Selector小工具一起从允许抓取(linecombinations.com)的网站上的表格中抓取数据。我已经花了几天时间,这就是我现在的位置。除了特定的解决方案外,还更喜欢一些教育。谢谢!

install.packages("rvest")
install.packages("dplr")
install.packages("stringr")
install.packages("magrittr")

library(rvest)
library(dplR)
library(stringr)
library(magrittr)

url <- "http://www.linecombinations.com/index.php?team=BOS&linetype=evf&range=10"
css <- ".col_66"

webpage <- read_html(url)
print(webpage)
mynode <- html_nodes(webpage,css)

mystr <- toString(mynode)
mystr <- gsub("<!--","",mystr)
mystr <- gsub("-->","",mystr)

newdiv <- read_html(mystr)

newtable <- html_nodes(newdiv,".col_66")
newframe <- html_table(newtable)

print(newframe)

1 个答案:

答案 0 :(得分:0)

您可以使用html_node并通过type selector将子项table descendant combinator添加到CSS中,即指定您希望子项table标签元素的父级为col_66

library(rvest)
library(magrittr)

table <- read_html('http://www.linecombinations.com/index.php?team=BOS&linetype=evf&range=10') %>%
         html_node('.col_66 table') %>% html_table()