如何使用R正确废弃网页

时间:2015-08-03 10:54:22

标签: html asp.net r

任何人都可以给我一些关于如何正确废弃这个网页的提示(带有传递参数的asp: http://statistiche.terna.it/statistiche/regioni.asp?ANNO=2013&AREA=Veneto

我的粗略尝试如下,我想知道是否有更有效的方法来处理它(因为你可以看到糟糕的结果,除其他外,是错误的行)

感谢

library(XML)

aaaa<-2013

url<-paste0("http://statistiche.terna.it/statistiche/regioni.asp?ANNO=", aaaa, "&AREA=Veneto")

tmp<-readHTMLTable(url, which=1, as.data.frame=TRUE, stringsAsFactors = FALSE)

head(tmp, 25)

1 个答案:

答案 0 :(得分:0)

您是否尝试过使用SelectorGadget的rvest包?

这给出了结果,但不知何故不读取负数。你可以找到出路:

web.html <- html("http://statistiche.terna.it/statistiche/regioni.asp?ANNO=2013&AREA=Veneto")
web.html_href <- web.html %>%
html_nodes("#DataTable") %>%
html_table(header = FALSE, fill = T)

web.html_href