Question

我无法有效地解析我从美国职业棒球大联盟（MLB）检索到的XML。

首先，这是一个侧面项目，旨在让我熟悉XML。我对R最熟悉，所以我觉得一旦成功，我就有更好的机会调试代码。

我可以通过以下代码行获取xml：

xmlurl<-"http://gd2.mlb.com/components/game/mlb/year_2012/month_06/day_11/miniscoreboard.xml"
xmltree<-xmlTreeParse(xmlurl,useInternalNodes=TRUE)

我希望能够在整个XML中提取信息。例如，对于今天所有比赛，我想提取每支球队得分的次数（“away_team_runs”＆amp;“home_team_runs”）。此外，我希望能够基本上从我希望的文档中提取任何内容，但到目前为止我还没有成功。

任何指针都会非常感激。

Answer 1

例如，使用xpathSApply

xpathSApply(xmltree,'//games/*',xmlGetAttr,'away_team_runs') 
[1] "6" "1" "3" "3"
xpathSApply(xmltree,'//games/*',xmlGetAttr,'home_team_runs') 
[1] "3" "4" "0" "2"

R中的MLB XML解析

1 个答案: