Python美化创建xml版本

时间:2017-10-03 14:39:31

标签: python xml prettify

当我启动此代码时,他生成了包含xml版本< \?xml version =“1.0”?>的xml文件,我尝试使用xml_declaration = False排除此行,但出现错误:

  

TypeError:prettify()得到了一个意外的关键字参数'encoding'

如何从xml文件中剪切此字符串?

from xml.etree import ElementTree
from xml.dom import minidom
from lxml.etree import Element, SubElement



def prettify(templateXml):
    rough_string = ElementTree.tostring(templateXml)
    reparsed = minidom.parseString(rough_string)
    return reparsed.toprettyxml(indent="\t")


top = Element('Options')
element = SubElement(top, 'Some ID')
element.text = ' '
element = SubElement(top, 'Test0')
element.text = 'Some text'
SubElement(top, 'Test1', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test2', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test3', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test4', {'enabled': 'true', 'Test5': 'true', 'Zero': 'true'})
SubElement(top, 'Test6', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test7', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test8', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
with open("output/some_xml_file.xml", 'w') as f:
    f.write(prettify(top))

3 个答案:

答案 0 :(得分:0)

问题在更改后解决:

from xml.etree import ElementTree
from xml.dom import minidom
from xml.etree.ElementTree import Element, SubElement


def prettify(elem):
    xml = ElementTree.tostring(elem)
    reparsed = minidom.parseString(xml)
    return reparsed.toprettyxml(indent="\t")


def strip_prologue(xml):
    if xml.startswith("<?xml"):
        return xml[xml.index(">") + 1:].lstrip()
    else:
        return xml


def generate_xml():
    top = Element('Heards')
    element = SubElement(top, 'SomeID')
    element.text = ' '
    element = SubElement(top, 'Test0')
    element.text = 'Some text'
    SubElement(top, 'Test1', {'enabled': 'true', 'Values': 'true'})
    SubElement(top, 'Test2', {'enabled': 'true', 'Values': 'true'})
    SubElement(top, 'Test3', {'enabled': 'true', 'Values': 'true'})
    SubElement(top, 'Test4', {'enabled': 'true', 'Test5': 'true', 'Zero': 'true'})
    SubElement(top, 'Test6', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
    SubElement(top, 'Test7', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
    SubElement(top, 'Test8', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
    with open("output/some_xml_file.xml", 'w') as f:
        f.write(strip_prologue(prettify(top)))

答案 1 :(得分:0)

只需在tostring()中使用lxml&#39; prettyprint参数即可。无需minidom甚至xml.etree。 Python的lxml可以作为完整的XML处理程序。并且一定要删除 Some ID 中的空格,以获得有效的XML名称。

import lxml.etree as et
from lxml.etree import Element, SubElement

top = Element('Options')
element = SubElement(top, 'SomeID')
element.text = ' '
element = SubElement(top, 'Test0')
element.text = 'Some text'
SubElement(top, 'Test1', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test2', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test3', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test4', {'enabled': 'true', 'Test5': 'true', 'Zero': 'true'})
SubElement(top, 'Test6', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test7', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test8', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})

with open("output/some_xml_file.xml", 'wb') as f:
    f.write(et.tostring(top, xml_declaration=True, pretty_print=True, encoding="utf-8"))

输出

<?xml version='1.0' encoding='utf-8'?>
<Options>
  <SomeID> </SomeID>
  <Test0>Some text</Test0>
  <Test1 Values="true" enabled="true"/>
  <Test2 Values="true" enabled="true"/>
  <Test3 Values="true" enabled="true"/>
  <Test4 Test5="true" Zero="true" enabled="true"/>
  <Test6 Values="true" Zero="true" enabled="true"/>
  <Test7 Values="true" Zero="true" enabled="true"/>
  <Test8 Values="true" Zero="true" enabled="true"/>
</Options>

答案 2 :(得分:0)

我遇到了类似的错误,在找到解决此问题的好方法之前,我使用了一种不太好的方法来解析未缩进的数据,并使用 tostring 方法而不使用 minidom。

from lxml import etree

tree = lxml.etree.parse("yourfile.xml")
pretty = lxml.etree.tostring(tree, encoding="unicode", pretty_print=True)

print(pretty) 

当我遇到同样的错误时,这对我有用,所以把它放在那里。