如何将XML中具有相同名称的多个节点转换为R中的df / list?

时间:2014-04-08 12:44:02

标签: xml r

这是我使用R的第一次使用XML的经历。所以,如果不是愚蠢的话,我的问题可能听起来很幼稚...... 我以

的模式下载了一个XML文件
<experiment>
  <sampleattribute>
    <category>AGE</category>
    <value>8</value>
    <value>10</value>
    <value>11</value>
  </sampleattribute>
  <sampleattribute>
    <category>SEX</category>
    <value>female</value>
    <value>male</value>
  </sampleattribute>
</experiment>
<experiment>
  <sampleattribute>
    <category>DESIGN</category>
    <value>control</value>
    <value>disease</value>
  </sampleattribute>
</experiment>
<experiment>
  <sampleattribute>
    <category>AGE</category>
    <value>8</value>
    <value>10</value>
    <value>11</value>
  </sampleattribute>
  <sampleattribute>
    <category>SEX</category>
    <value>female</value>
  </sampleattribute>
  <sampleattribute>
    <category>DESIGN</category>
    <value>control</value>
    <value>disease</value>
  </sampleattribute>
</experiment>

如您所见,每个节点都有不同。我希望以最终将它转换为数据帧的方式连接每个中的所有sampleattribute。

我已经尝试了attr&lt; - xpathSApply(myxml,&#34; // experiment / sampleattribute&#34;),但无法追踪哪个样本有哪些。

非常感谢任何建议。

1 个答案:

答案 0 :(得分:0)

您无法获得具有此类XML的dataframe,而是列表。

使用XML包可以执行此操作,例如:

doc = htmlParse(txt,asText=TRUE)

res = lapply(xpathSApply(doc,'//experiment'),
       function(x){
         category = xpathSApply(x,'sampleattribute/category',xmlValue)
         values = xpathSApply(x,'sampleattribute/value',xmlValue)
         list(category=category,
              values =values)
       })

然后你可以检查你的结果:

 str(res)
 List of 3
 $ :List of 2
  ..$ category: chr [1:2] "AGE" "SEX"
  ..$ values  : chr [1:5] "8" "10" "11" "female" ...
 $ :List of 2
  ..$ category: chr "DESIGN"
  ..$ values  : chr [1:2] "control" "disease"
 $ :List of 2
  ..$ category: chr [1:3] "AGE" "SEX" "DESIGN"
  ..$ values  : chr [1:6] "8" "10" "11" "female" ..