从R中的同一网站刮取多个目录

时间:2017-02-09 13:45:12

标签: r

我正在尝试创建数据库similar to this one,但使用不同的表格。

我有一个playerids列表(在mbp_example.csv文件中),我循环遍历每个playerids网站并拉动表格" 2016 Player Batting Splits" (example here)。但是,我不断收到多种错误类型。

我在下面列出了我的代码:

c('rvest','dplyr') -> packages #installs packages
lapply(packages, library, character.only = T)

id <- read.csv("mbp.csv")
url <- "http://www.baseball-reference.com/register/player.cgi?id="
ids=c(id)
stats_table <- '#batting_splits_milb.sortable.stats_table'
stats_id <- paste0(stats_table,' a')
minors_splits <- data.frame()
for (ids in ids) {
html <- paste(url,ids,"&type=bgl&year=2016",sep="")
read_html(html) %>%
html_nodes(stats_table) %>%
html_table(header = T) %>%
data.frame() %>%
tbl_df() -> df
df <- df[1:nrow(df),]
df$ids <- c(ids)
minors_splits <- rbind(minors_splits,df)
}

这给了我以下错误:

Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) : 
  expecting a single value

Error in rbind(deparse.level, ...) : 
  numbers of columns of arguments do not match

0 个答案:

没有答案