我如何解析python中的xml文件

时间:2019-03-28 05:41:57

标签: python xml jenkins

我有一个xml文件(基本上该文件是jenkins从属config.xml文件),我必须从中获取某些值。 因此,我尝试使用xml这样的解析Element Tree文件

tree = ET.parse(config.xml)
root = tree.getroot()
print root
for item in root.findall('slave'):

然后我将这个解析后的xml文件保存在一个文本文件中,现在我想获取该标签中的值 我可以通过bash完成操作,但我想知道如何在python中执行此操作 这是bash代码

cat test.xml | sed -n 's:.*<label>\(.*\)</label>.*:\1:p'

这是jenkins从属config.xml文件的示例

<slave>
<name>some_name</name>
<description/>
<remoteFS>some_value</remoteFS>
<numExecutors>xx</numExecutors>
<mode>EXCLUSIVE</mode>
<retentionStrategy class="xxxx"/>
<launcher class="xxxxx" plugin="xxxxx">
    <host>xxx.x.x.xx</host>
    <port>xx</port>
    <credentialsId>xxxxxxx-xxx-xxxx-xxxx-xxxxxxxxxxxx</credentialsId>
    <maxNumRetries>0</maxNumRetries>
    <retryWaitTime>0</retryWaitTime>
    <sshHostKeyVerificationStrategy class="hudson.plugins.sshslaves.verifiers.NonVerifyingKeyVerificationStrategy/></launcher>
    <label>some_label</label>
</slave>

与标签类似,我还需要其他值,例如主机名,端口等。

1 个答案:

答案 0 :(得分:2)

您可以使用.iter()进行递归迭代以查找元素。选中the official documentation

这里是从label节点打印hostslave文本的示例。

更新:修改了code.py,以另外打印class标签的launcher属性值。它使用element.attrib获取标签的属性。可以在official documentation of parsing XML中找到更多信息。

test.xml

<slave>
    <name>some_name</name>
    <description/>
    <remoteFS>some_value</remoteFS>
    <numExecutors>xx</numExecutors>
    <mode>xxx</mode>
    <retentionStrategy class="xxxx"/>
    <launcher class="xxxxx" plugin="xxxxx">
        <host>xxx.x.x.xx</host>
        <port>xx</port>
        <credentialsId>xxxxxxxx</credentialsId>
        <maxNumRetries>x</maxNumRetries>
        <retryWaitTime>x</retryWaitTime>
        <sshHostKeyVerificationStrategy class="hudson.plugins.sshslaves.verifiers.NonVerifyingKeyVerificationStrategy"/>
    </launcher>
    <label>somelabel</label>
</slave>

code.py

import xml.etree.ElementTree as ET
tree = ET.parse("test.xml")
root = tree.getroot()

for item in root.iter('slave'):
    for label in item.iter("label"):
        print label.text
    for host in item.iter("host"):
        print host.text
    for launcher in item.iter("launcher"):
        print launcher.attrib["class"]

输出:

somelabel
xxx.x.x.xx
xxxxx