我正在尝试创建数据库similar to this one,但使用不同的表格。
我有一个playerids列表(在mbp_example.csv文件中),我循环遍历每个playerids网站并拉动表格" 2016 Player Batting Splits" (example here)。但是,我不断收到多种错误类型。
我在下面列出了我的代码:
c('rvest','dplyr') -> packages #installs packages
lapply(packages, library, character.only = T)
id <- read.csv("mbp.csv")
url <- "http://www.baseball-reference.com/register/player.cgi?id="
ids=c(id)
stats_table <- '#batting_splits_milb.sortable.stats_table'
stats_id <- paste0(stats_table,' a')
minors_splits <- data.frame()
for (ids in ids) {
html <- paste(url,ids,"&type=bgl&year=2016",sep="")
read_html(html) %>%
html_nodes(stats_table) %>%
html_table(header = T) %>%
data.frame() %>%
tbl_df() -> df
df <- df[1:nrow(df),]
df$ids <- c(ids)
minors_splits <- rbind(minors_splits,df)
}
这给了我以下错误:
Error in doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) :
expecting a single value
或
Error in rbind(deparse.level, ...) :
numbers of columns of arguments do not match