R中的readHTMLTable

时间:2014-04-21 12:31:56

标签: html r

我正在尝试读取R中的html表,并对其进行进一步分析。我在R中找到了readHTMLTable()。当我下载我感兴趣的表,并尝试对它进行一些分析时,我得到了一个回复,即向量为NULL,并且很难将它转换为数字,所以我可以执行平均值,并进一步计算。如果有人有任何想法可以提供帮助,那就太棒了!我在下面附上我的代码。 非常感谢

亚历

a=readHTMLTable("http://www.nhl.com/ice/standings.htm?season=20132014&type=LEA",which=3,trim=F,colClasses)
summary(a)
a=droplevels(a)
summary(a)

1 个答案:

答案 0 :(得分:1)

以下为我效劳:

require(XML)
appURL <- "http://www.nhl.com/ice/standings.htm?season=20132014&type=LEA"
xData <- htmlParse(appURL)
appStats <- readHTMLTable(xData['//table'][[3]])
> head(appStats)
    structure(c("p - Boston", "z - Anaheim", "y - Colorado", "x - St. Louis",  DIV  GP   W   L   OT   P   ROW   GF   GA   Diff    Home    Away   S/O 
1 1                                                                 p - Boston   A   82  54  19    9 117    51  261  177    +84  31-7-3 23-12-6   3-6
2 2                                                                z - Anaheim   P   82  54  20    8 116    51  266  209    +57  29-8-4 25-12-4   3-6
3 3                                                               y - Colorado   C   82  52  22    8 112    47  250  220    +30 26-11-4 26-11-4   5-4
4 4                                                              x - St. Louis   C   82  52  23    7 111    43  248  191    +57  28-9-4 24-14-3   9-3
5 5                                                               x - San Jose   P   82  51  22    9 111    41  249  200    +49  29-7-5 22-15-4  10-7
6 6                                                             y - Pittsburgh   M   82  51  24    7 109    44  249  207    +42  28-9-4 23-15-3   7-3
   L10   Streak 
1 5-2-3   Lost 1
2 7-2-1    Won 4
3 7-1-2     OT 1
4 3-7-0   Lost 6
5 5-4-1    Won 2
6 5-3-2     OT 2