我试图使用R从pinnacle网站提取信息,所以这是我目前的代码
p_bd_url <- c("https://www.pinnacle.com/en/odds/match/soccer/germany/bundesliga?sport=True")
p_bd <- read_html(p_bd_url)
p_bd_scrape <- p_bd %>% html_node(xpath = '//*[@id="left-content"]/div/div[2]/div[2]/div/div[2]/div[3]')
p_bd_teams <- p_bd_scrape %>% html_nodes("div") %>% html_nodes("table") %>% html_nodes("tbody") %>% html_nodes("tr") %>% html_nodes(".game-name.name") %>% html_nodes("span") %>% html_text()
由于某种原因,输出与网页上的文字不同。
[1] "{{participant.Name}}" "{{'Draw' | guestlinesDraw}}" "{{participant.Pitcher}}"
我该怎么做才能修复?
另外 - 有什么办法我可以抓取整个页面代码,然后用指定的类提取所有div
标签?或者使用rvest的唯一方法是指定标签或使用xpath?
谢谢!