当我启动此代码时,他生成了包含xml版本< \?xml version =“1.0”?>的xml文件,我尝试使用xml_declaration = False排除此行,但出现错误:
TypeError:prettify()得到了一个意外的关键字参数'encoding'
如何从xml文件中剪切此字符串?
from xml.etree import ElementTree
from xml.dom import minidom
from lxml.etree import Element, SubElement
def prettify(templateXml):
rough_string = ElementTree.tostring(templateXml)
reparsed = minidom.parseString(rough_string)
return reparsed.toprettyxml(indent="\t")
top = Element('Options')
element = SubElement(top, 'Some ID')
element.text = ' '
element = SubElement(top, 'Test0')
element.text = 'Some text'
SubElement(top, 'Test1', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test2', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test3', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test4', {'enabled': 'true', 'Test5': 'true', 'Zero': 'true'})
SubElement(top, 'Test6', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test7', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test8', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
with open("output/some_xml_file.xml", 'w') as f:
f.write(prettify(top))
答案 0 :(得分:0)
问题在更改后解决:
from xml.etree import ElementTree
from xml.dom import minidom
from xml.etree.ElementTree import Element, SubElement
def prettify(elem):
xml = ElementTree.tostring(elem)
reparsed = minidom.parseString(xml)
return reparsed.toprettyxml(indent="\t")
def strip_prologue(xml):
if xml.startswith("<?xml"):
return xml[xml.index(">") + 1:].lstrip()
else:
return xml
def generate_xml():
top = Element('Heards')
element = SubElement(top, 'SomeID')
element.text = ' '
element = SubElement(top, 'Test0')
element.text = 'Some text'
SubElement(top, 'Test1', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test2', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test3', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test4', {'enabled': 'true', 'Test5': 'true', 'Zero': 'true'})
SubElement(top, 'Test6', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test7', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test8', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
with open("output/some_xml_file.xml", 'w') as f:
f.write(strip_prologue(prettify(top)))
答案 1 :(得分:0)
只需在tostring()
中使用lxml&#39; prettyprint参数即可。无需minidom
甚至xml.etree
。 Python的lxml
可以作为完整的XML处理程序。并且一定要删除 Some ID 中的空格,以获得有效的XML名称。
import lxml.etree as et
from lxml.etree import Element, SubElement
top = Element('Options')
element = SubElement(top, 'SomeID')
element.text = ' '
element = SubElement(top, 'Test0')
element.text = 'Some text'
SubElement(top, 'Test1', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test2', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test3', {'enabled': 'true', 'Values': 'true'})
SubElement(top, 'Test4', {'enabled': 'true', 'Test5': 'true', 'Zero': 'true'})
SubElement(top, 'Test6', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test7', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
SubElement(top, 'Test8', {'enabled': 'true', 'Values': 'true', 'Zero': 'true'})
with open("output/some_xml_file.xml", 'wb') as f:
f.write(et.tostring(top, xml_declaration=True, pretty_print=True, encoding="utf-8"))
输出
<?xml version='1.0' encoding='utf-8'?>
<Options>
<SomeID> </SomeID>
<Test0>Some text</Test0>
<Test1 Values="true" enabled="true"/>
<Test2 Values="true" enabled="true"/>
<Test3 Values="true" enabled="true"/>
<Test4 Test5="true" Zero="true" enabled="true"/>
<Test6 Values="true" Zero="true" enabled="true"/>
<Test7 Values="true" Zero="true" enabled="true"/>
<Test8 Values="true" Zero="true" enabled="true"/>
</Options>
答案 2 :(得分:0)
我遇到了类似的错误,在找到解决此问题的好方法之前,我使用了一种不太好的方法来解析未缩进的数据,并使用 tostring 方法而不使用 minidom。
from lxml import etree
tree = lxml.etree.parse("yourfile.xml")
pretty = lxml.etree.tostring(tree, encoding="unicode", pretty_print=True)
print(pretty)
当我遇到同样的错误时,这对我有用,所以把它放在那里。