R中的MLB XML解析

时间:2012-12-15 04:26:48

标签: xml r

我无法有效地解析我从美国职业棒球大联盟(MLB)检索到的XML。

首先,这是一个侧面项目,旨在让我熟悉XML。我对R最熟悉,所以我觉得一旦成功,我就有更好的机会调试代码。

我可以通过以下代码行获取xml:

xmlurl<-"http://gd2.mlb.com/components/game/mlb/year_2012/month_06/day_11/miniscoreboard.xml"
xmltree<-xmlTreeParse(xmlurl,useInternalNodes=TRUE)

我希望能够在整个XML中提取信息。例如,对于今天所有比赛,我想提取每支球队得分的次数(“away_team_runs”&amp;“home_team_runs”)。此外,我希望能够基本上从我希望的文档中提取任何内容,但到目前为止我还没有成功。

任何指针都会非常感激。

1 个答案:

答案 0 :(得分:2)

例如,使用xpathSApply

xpathSApply(xmltree,'//games/*',xmlGetAttr,'away_team_runs') 
[1] "6" "1" "3" "3"
xpathSApply(xmltree,'//games/*',xmlGetAttr,'home_team_runs') 
[1] "3" "4" "0" "2"