任何人都可以给我一些关于如何正确废弃这个网页的提示(带有传递参数的asp: http://statistiche.terna.it/statistiche/regioni.asp?ANNO=2013&AREA=Veneto)
我的粗略尝试如下,我想知道是否有更有效的方法来处理它(因为你可以看到糟糕的结果,除其他外,是错误的行)
感谢
library(XML)
aaaa<-2013
url<-paste0("http://statistiche.terna.it/statistiche/regioni.asp?ANNO=", aaaa, "&AREA=Veneto")
tmp<-readHTMLTable(url, which=1, as.data.frame=TRUE, stringsAsFactors = FALSE)
head(tmp, 25)
答案 0 :(得分:0)
您是否尝试过使用SelectorGadget的rvest
包?
这给出了结果,但不知何故不读取负数。你可以找到出路:
web.html <- html("http://statistiche.terna.it/statistiche/regioni.asp?ANNO=2013&AREA=Veneto")
web.html_href <- web.html %>%
html_nodes("#DataTable") %>%
html_table(header = FALSE, fill = T)
web.html_href