我想从我拥有的许多XML记录构建一个R数据集(确切地说是14,000)。我可以设法从每个XML文件中提取值但我不知道如何创建一个循环来创建数据组。
当我提取值时,列名是
SA_Data_1$substring
是:
<?xml version="1.0"?>
<ConsumerEnquiry>
<Session>
<User_ID>ROCK1</User_ID>
<FullName>ROCK1</FullName>
<GroupName>014828</GroupName>
<Subscriber_ID>14828</Subscriber_ID>
<Group_ID>014828</Group_ID>
<RequestType>XML2</RequestType>
<Environment>PRODUCTION</Environment>
<Version>1.0.0</Version>
</Session>
</ConsumerEnquiry>
所以我用:
SA_parsed = xmlParse(SA_Data_1$substring)
file3= xmlToList (SA_parsed)
stack(sapply(file3,length))
v1 = as.matrix(file3$Session)
它将数据集设为:
V1
1 ROCKLEND1
2 ROCKLEND1
3 014828
4 14828
5 014828
6 XML2
7 PRODUCTION
8 1.0.0
所以列名是随机的1,2,3等。我怎样才能重命名它们?如何提取14000个类似的记录并将它们放入数据集?
我不期待一个解决方案,但是可以指导我完成整个过程的人......概述......会很棒