如何向没有单个根标签的现有XML添加根

时间:2019-04-01 12:47:14

标签: python xml parse-error

我有一个没有单个根标签的XML文件。我想向该XML文件添加一个新的Root标记。

下面是现有的XML:

<A>
    <Val>123</Val>
</A>

<B>
    <Val1>456</Val1>
</B>

现在,我想添加一个根标记“ X”,因此最终的XML如下所示:

<X>
  <A>
     <Val>123</Val>
  </A>

  <B>
     <Val1>456</Val1>
  </B>
</X>

我尝试使用以下python代码:

from xml.etree import ElementTree as ET  
root = ET.parse(Input_FilePath).getroot()   
newroot = ET.Element("X")    
newroot.insert(0, root)    
tree = ET.ElementTree(newroot)    
tree.write(Output_FilePath)

但是在第一行,我得到以下错误:

xml.etree.ElementTree.ParseError: junk after document element: line 4, column 4

2 个答案:

答案 0 :(得分:2)

@kjhughes在评论中指出,XML规范要求文档必须具有单个根元素。

from xml.etree import ElementTree as ET

node = ET.parse(Input_FilePath)
xml.etree.ElementTree.ParseError: junk after document element: line 4, column 0

您需要手动读取文件并自己添加标签:

from xml.etree import ElementTree as ET

with open(Input_FilePath) as f:
    xml_string = '<X>' + f.read() + '</X>'

node = ET.fromstring(xml_string)

答案 1 :(得分:0)

我认为您可以不使用xml解析器。 如果您知道根标签丢失,则可以通过这种方式添加它。

with open('test.xml', 'r') as f:
    data = f.read()

with open('test.xml', 'w') as f:
    f.write("<x>\n" + data + "\n</x>")
    f.close()

如果不知道,您可以通过以下方式进行检查:

   import re
   if re.match(u"\s*<x>.*</x>", text, re.S) != None:
      #do something   
      pass