我无法有效地解析我从美国职业棒球大联盟(MLB)检索到的XML。
首先,这是一个侧面项目,旨在让我熟悉XML。我对R最熟悉,所以我觉得一旦成功,我就有更好的机会调试代码。
我可以通过以下代码行获取xml:
xmlurl<-"http://gd2.mlb.com/components/game/mlb/year_2012/month_06/day_11/miniscoreboard.xml"
xmltree<-xmlTreeParse(xmlurl,useInternalNodes=TRUE)
我希望能够在整个XML中提取信息。例如,对于今天所有比赛,我想提取每支球队得分的次数(“away_team_runs”&amp;“home_team_runs”)。此外,我希望能够基本上从我希望的文档中提取任何内容,但到目前为止我还没有成功。
任何指针都会非常感激。
答案 0 :(得分:2)
例如,使用xpathSApply
xpathSApply(xmltree,'//games/*',xmlGetAttr,'away_team_runs')
[1] "6" "1" "3" "3"
xpathSApply(xmltree,'//games/*',xmlGetAttr,'home_team_runs')
[1] "3" "4" "0" "2"