rvest web scraping输出错误

时间:2017-10-10 11:07:25

标签: r web-scraping

我试图使用R从pinnacle网站提取信息,所以这是我目前的代码

p_bd_url <- c("https://www.pinnacle.com/en/odds/match/soccer/germany/bundesliga?sport=True")
p_bd <- read_html(p_bd_url)
p_bd_scrape <- p_bd %>% html_node(xpath = '//*[@id="left-content"]/div/div[2]/div[2]/div/div[2]/div[3]')
p_bd_teams <- p_bd_scrape %>% html_nodes("div") %>% html_nodes("table") %>% html_nodes("tbody") %>% html_nodes("tr") %>% html_nodes(".game-name.name") %>% html_nodes("span") %>% html_text()

由于某种原因,输出与网页上的文字不同。

[1] "{{participant.Name}}"        "{{'Draw' | guestlinesDraw}}" "{{participant.Pitcher}}"    

我该怎么做才能修复? 另外 - 有什么办法我可以抓取整个页面代码,然后用指定的类提取所有div标签?或者使用rvest的唯一方法是指定标签或使用xpath?

谢谢!

0 个答案:

没有答案