我正在尝试学习尽可能多的互联网知识,但是到处都是试图弄清楚这一点。我正在与rvest和Selector小工具一起从允许抓取(linecombinations.com)的网站上的表格中抓取数据。我已经花了几天时间,这就是我现在的位置。除了特定的解决方案外,还更喜欢一些教育。谢谢!
install.packages("rvest")
install.packages("dplr")
install.packages("stringr")
install.packages("magrittr")
library(rvest)
library(dplR)
library(stringr)
library(magrittr)
url <- "http://www.linecombinations.com/index.php?team=BOS&linetype=evf&range=10"
css <- ".col_66"
webpage <- read_html(url)
print(webpage)
mynode <- html_nodes(webpage,css)
mystr <- toString(mynode)
mystr <- gsub("<!--","",mystr)
mystr <- gsub("-->","",mystr)
newdiv <- read_html(mystr)
newtable <- html_nodes(newdiv,".col_66")
newframe <- html_table(newtable)
print(newframe)
答案 0 :(得分:0)
您可以使用html_node并通过type selector将子项table
descendant combinator添加到CSS中,即指定您希望子项table
标签元素的父级为col_66
:
library(rvest)
library(magrittr)
table <- read_html('http://www.linecombinations.com/index.php?team=BOS&linetype=evf&range=10') %>%
html_node('.col_66 table') %>% html_table()