我有一大堆现有的xml文件,我正在尝试为所有这些文件添加一个元素(它们是许多maven项目的pom.xml,我正在尝试向所有项目添加父元素他们)。以下是我的确切代码。
问题是pom2.xml中的最终xml输出在一行中有完整的parent
元素。但是,当我单独打印元素时,它会照常将它写成4行。如何使用parent
元素的正确格式打印出完整的xml?
from lxml import etree
parentPom = etree.Element('parent')
groupId = etree.Element('groupId')
groupId.text = 'org.myorg'
parentPom.append(groupId)
artifactId = etree.Element('artifactId')
artifactId.text = 'myorg-master-pom'
parentPom.append(artifactId)
version = etree.Element('version')
version.text = '1.0.0'
parentPom.append(version)
print etree.tostring(parentPom, pretty_print=True)
pom = etree.parse("pom.xml")
projectElement = pom.getroot()
projectElement.insert(0, parentPom)
file = open("pom2.xml", 'wb')
file.write(etree.tostring(projectElement, pretty_print=True))
file.close()
打印输出:
<parent>
<groupId>org.myorg</groupId>
<artifactId>myorg-master-pom</artifactId>
<version>1.0.0</version>
</parent>
pom2.xml中相同元素的输出:
<parent><groupId>com.inmobi</groupId><artifactId>inmobi-master-pom</artifactId><version>1.0.1</version></parent><modelVersion>4.0.0</modelVersion>
答案 0 :(得分:12)
这可能是您感兴趣的。
http://lxml.de/FAQ.html#why-doesn-t-the-pretty-print-option-reformat-my-xml-output
简而言之,以供将来参考:
parser = etree.XMLParser(remove_blank_text=True)
pom = etree.parse("pom.xml",parser)