这对我有用:
library(XML)
tables <- readHTMLTable("http://cdec.water.ca.gov/reportapp/javareports?name=FNF", as.data.frame = TRUE)
bottom_table <- tables[[2]]
# process bottom_table's data, deploy to Shiny app
但是当我使用https
而不是http
时:
tables <- readHTMLTable("https://cdec.water.ca.gov/reportapp/javareports?name=FNF", as.data.frame = TRUE)
# Warning: XML content does not seem to be XML`
因此,我正在寻求学习如何识别表的内容类型以及用于抓取和保留表格式的R库/函数。感谢您的提示。
答案 0 :(得分:0)
有R个函数来确定数据帧的类和维,这是预期的readHTMLTable使用您提供的as.data.frames参数传递的。
?readHTMLTable
> class(bottom_table)
#[1] "data.frame"
> dim(bottom_table)
#[1] 40 9
也:
?rownames
?colnames