Python Lxml:将自己的标签添加到XML文件中

时间:2015-07-22 22:29:04

标签: python xml lxml

我将自己的元素(标签)添加到我从文件中解析过的XML树时遇到了问题。

如果我尝试将元素添加到现有树中,即文件中的那个元素,那么无论我使用new_tag = etree.Subelement(self.root, "new_tag")还是正文,它都无法正确添加 new_tag = Element("new_tag") self.root.append(new_tag)

self.root.tostring()的返回看起来很棒,添加的元素没有以正确的方式缩进,例如len(self.root)仍然返回与添加元素之前相同的值。

我唯一与examples at lxml.de不同的是,我将所有这些东西都放在了一个班级......但为什么不应该这样做呢?

我希望你能帮助我,因为我正在寻找那个大约3个小时的错误而且我找不到它。

莱昂

编辑:

这是代码:

#!/usr/bin/env python3

from lxml import etree

class MyClass(object):
    def __init__(self, xml_filepath = "data.xml"):
        '''
        Constructor
        '''
        self._xml_path = xml_filepath

        with open(self._xml_path) as input_file:
            self.tree = etree.parse(input_file)
        self.xml_tags = self.tree.getroot()[0]

    def read_something(self):


        return [tag.tag for tag in self.tree.iter("child")]

    def change_something(self):
        self.xml_tags[0].tag = "test"

    def add_something(self):
        for elements in self.tree.iter('Home'):        
            child = etree.Element("child")
            child2 = etree.Element("child2")
            elements.insert(1,child)
            child.insert(0, child2)
            child2.text = "23123"

    def to_string(self):
        list_ = list(self.tree.getroot()[0])
        print(list_)
        return(etree.tostring(self.tree, pretty_print=True, xml_declaration=True).decode())

if __name__ == '__main__':
    testClass = MyClass()
    testClass.change_something()
    testClass.add_something()
    print(testClass.to_string())
    print(testClass.read_something())
返回的是:

[<Element test at 0x765e7e68>, <Element child at 0x765e7e90>]
<?xml version='1.0' encoding='ASCII'?>
<root>
  <Home>
    <test>
      <name>Hello world</name>
    </test>
  <child><child2>23123</child2></child></Home>
</root>

['child']

和原始的xml文件:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <Home>
    <test>      
      <name>Hello world</name>
    </test>    
  </Home>
</root>

2 个答案:

答案 0 :(得分:0)

您必须直接找到根然后插入。您正在查看的教程不解析示例xml文件,但实际上创建了根元素和子元素:

import lxml.etree as ET

dom = ET.parse('C:\Path\To\XMLFile.xml')

for elements in dom.iter('root'):        
    child = ET.Element("child")
    elements.insert(1,child)
    child.text = '...'

答案 1 :(得分:0)

我自己找到了错误。 如果我将自己的解析器添加到解析方法中,我将获得格式良好的XML输出,现在内部工作也很好。