Question

我正在尝试创建数据库similar to this one，但使用不同的表格。

我有一个playerids列表（在mbp_example.csv文件中），我循环遍历每个playerids网站并拉动表格＆＃34; 2016 Player Batting Splits＆＃34; （example here）。但是，我不断收到多种错误类型。

我在下面列出了我的代码：

c('rvest','dplyr') -> packages #installs packages
lapply(packages, library, character.only = T)

id <- read.csv("mbp.csv")
url <- "http://www.baseball-reference.com/register/player.cgi?id="
ids=c(id)
stats_table <- '#batting_splits_milb.sortable.stats_table'
stats_id <- paste0(stats_table,' a')
minors_splits <- data.frame()
for (ids in ids) {
html <- paste(url,ids,"&type=bgl&year=2016",sep="")
read_html(html) %>%
html_nodes(stats_table) %>%
html_table(header = T) %>%
data.frame() %>%
tbl_df() -> df
df <- df[1:nrow(df),]
df$ids <- c(ids)
minors_splits <- rbind(minors_splits,df)
}

这给了我以下错误：

Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) : 
  expecting a single value

或

Error in rbind(deparse.level, ...) : 
  numbers of columns of arguments do not match

从R中的同一网站刮取多个目录

0 个答案: