我有一个没有单个根标签的XML文件。我想向该XML文件添加一个新的Root标记。
下面是现有的XML:
<A>
<Val>123</Val>
</A>
<B>
<Val1>456</Val1>
</B>
现在,我想添加一个根标记“ X”,因此最终的XML如下所示:
<X>
<A>
<Val>123</Val>
</A>
<B>
<Val1>456</Val1>
</B>
</X>
我尝试使用以下python代码:
from xml.etree import ElementTree as ET
root = ET.parse(Input_FilePath).getroot()
newroot = ET.Element("X")
newroot.insert(0, root)
tree = ET.ElementTree(newroot)
tree.write(Output_FilePath)
但是在第一行,我得到以下错误:
xml.etree.ElementTree.ParseError: junk after document element: line 4, column 4
答案 0 :(得分:2)
@kjhughes在评论中指出,XML规范要求文档必须具有单个根元素。
from xml.etree import ElementTree as ET
node = ET.parse(Input_FilePath)
xml.etree.ElementTree.ParseError: junk after document element: line 4, column 0
您需要手动读取文件并自己添加标签:
from xml.etree import ElementTree as ET
with open(Input_FilePath) as f:
xml_string = '<X>' + f.read() + '</X>'
node = ET.fromstring(xml_string)
答案 1 :(得分:0)
我认为您可以不使用xml解析器。 如果您知道根标签丢失,则可以通过这种方式添加它。
with open('test.xml', 'r') as f:
data = f.read()
with open('test.xml', 'w') as f:
f.write("<x>\n" + data + "\n</x>")
f.close()
如果不知道,您可以通过以下方式进行检查:
import re
if re.match(u"\s*<x>.*</x>", text, re.S) != None:
#do something
pass