Scraping在R中注释掉了表格

时间:2017-04-19 20:38:15

标签: r xml web-scraping

我使用的这段相同的代码在一两个月前就像一个魅力。现在,在重新审视该项目时,我发现它根本不再有效。我对这个主题的了解是朦胧的;我从早先在这个论坛上提出的一个问题中得出了这个代码。任何人都可以解释发生了什么,或者可能发生了什么?我唯一能想到的是,如果我正在抓取的网页以某种方式改变了他们的代码,也许我不再反映这些变化?这是我正在使用的内容(我为下面引用的所有软件包道歉。我不知道是否在这些代码中使用了它们):

library(rvest)
library(XML)
library(tidyr)
library(zoo)
library(chron)
library(lubridate)
library(stringr)
library(data.table)
library(dplyr)
page.201702050atl = read_html("http://www.pro-football-reference.com/boxscores/201702050atl.htm")
comments.201702050atl = page.201702050atl %>% html_nodes(xpath = "//comment()")
game.info.201702050atl = comments.201702050atl[17] %>% html_text() %>% read_html() %>% html_node("#game_info") %>% html_table()

这是我收到的错误消息:

> game.info.201702050atl = comments.201702050atl[17] %>% html_text() %>% read_html() %>% html_node("#game_info") %>% html_table()
Error: ' /div.#akunit_mobile_1 ' does not exist in current working directory ('C:/Users/Brandon/Documents/Data Prophets/Football').

感谢您的帮助!

0 个答案:

没有答案