lxml在将新元素插入现有xml时不添加换行符

时间:2012-12-03 12:12:56

标签: python lxml

我有一大堆现有的xml文件,我正在尝试为所有这些文件添加一个元素(它们是许多maven项目的pom.xml,我正在尝试向所有项目添加父元素他们)。以下是我的确切代码。

问题是pom2.xml中的最终xml输出在一行中有完整的parent元素。但是,当我单独打印元素时,它会照常将它写成4行。如何使用parent元素的正确格式打印出完整的xml?

from lxml import etree

parentPom = etree.Element('parent')
groupId = etree.Element('groupId')
groupId.text = 'org.myorg'
parentPom.append(groupId)

artifactId = etree.Element('artifactId')
artifactId.text = 'myorg-master-pom'
parentPom.append(artifactId)

version = etree.Element('version')
version.text = '1.0.0'
parentPom.append(version)

print etree.tostring(parentPom, pretty_print=True)

pom = etree.parse("pom.xml")
projectElement = pom.getroot()
projectElement.insert(0, parentPom)

file = open("pom2.xml", 'wb')
file.write(etree.tostring(projectElement, pretty_print=True))
file.close()

打印输出:

<parent>
  <groupId>org.myorg</groupId>
  <artifactId>myorg-master-pom</artifactId>
  <version>1.0.0</version>
</parent>

pom2.xml中相同元素的输出:

<parent><groupId>com.inmobi</groupId><artifactId>inmobi-master-pom</artifactId><version>1.0.1</version></parent><modelVersion>4.0.0</modelVersion>

1 个答案:

答案 0 :(得分:12)

这可能是您感兴趣的。

http://lxml.de/FAQ.html#why-doesn-t-the-pretty-print-option-reformat-my-xml-output

简而言之,以供将来参考:

parser = etree.XMLParser(remove_blank_text=True)
pom = etree.parse("pom.xml",parser)