Question

我试图阅读一个每个月都要更新的表格，我已经四处搜索但无法修复它，请帮忙，谢谢！

library(XML)
MEItable <- htmlTreeParse("http://www.esrl.noaa.gov/psd/enso/mei/table.html") 
pre <- MEItable$children$html
pre <- unlist(pre[["body"]][names(body[["body"]]) == "pre"])

Answer 1

看起来您并不需要XML来阅读该网页。事实上，使用read.table和一些参数会更容易。这也可能更快，因为没有处理任何xml / html文档内容。

> URL <- "http://www.esrl.noaa.gov/psd/enso/mei/table.html"
> rt <- read.table(URL, skip = 12L, nrow = 65L, fill = TRUE, header = TRUE)
> head(rt, 3)[1:8]
#   YEAR DECJAN JANFEB FEBMAR MARAPR APRMAY MAYJUN JUNJUL
# 1 1950 -1.018 -1.143 -1.290 -1.061 -1.416 -1.372 -1.332
# 2 1951 -1.069 -1.193 -1.208 -0.439 -0.305  0.438  0.715
# 3 1952  0.408  0.135  0.086  0.257 -0.289 -0.657 -0.255

如何使用R从HTML中读取表

1 个答案: