我有一个xml文件,我正在使用lxml中的etree来处理,但是当我向它添加标签时,漂亮的打印似乎不起作用。
>>> from lxml import etree
>>> root = etree.parse('file.xml').getroot()
>>> print etree.tostring(root, pretty_print = True)
<root>
<x>
<y>test1</y>
</x>
</root>
到目前为止一切顺利。但现在
>>> x = root.find('x')
>>> z = etree.SubElement(x, 'z')
>>> etree.SubElement(z, 'z1').attrib['value'] = 'val1'
>>> print etree.tostring(root, pretty_print = True)
<root>
<x>
<y>test1</y>
<z><z1 value="val1"/></z></x>
</root>
它不再漂亮。我还试图“向后”创建z1标签,然后创建z标签并将z1附加到它,然后将z标签附加到x标签。但我得到了同样的结果。
如果我不解析文件并且只是一次创建所有标签,它将正确打印。所以我认为它与解析文件有关。
如何才能让漂亮的打印工作?
答案 0 :(得分:38)
它与lxml
处理空格的方式有关 - 请参阅lxml FAQ了解详情。
要解决此问题,请将文件的加载部分更改为以下内容:
parser = etree.XMLParser(remove_blank_text=True)
root = etree.parse('file.xml', parser).getroot()
我没有对它进行测试,但它应该通过此更改缩进您的文件。
答案 1 :(得分:0)
对于写入文件的人,我遇到同样的问题:
我创建了一个辅助函数,该函数在运行主函数后进行pretty_prints
。from lxml import etree
def ppxml(xml):
parser = etree.XMLParser(remove_blank_text=True)
tree = etree.parse(xml, parser)
tree.write(xml, encoding='utf-8', pretty_print=True, xml_declaration=True)
在我的主程序文件中
if __name__ == '__main__':
main()
ppxml(xml)