我有一个xml文件(基本上该文件是jenkins从属config.xml文件),我必须从中获取某些值。
因此,我尝试使用xml
这样的解析Element Tree
文件
tree = ET.parse(config.xml)
root = tree.getroot()
print root
for item in root.findall('slave'):
然后我将这个解析后的xml
文件保存在一个文本文件中,现在我想获取该标签中的值
我可以通过bash
完成操作,但我想知道如何在python中执行此操作
这是bash代码
cat test.xml | sed -n 's:.*<label>\(.*\)</label>.*:\1:p'
这是jenkins从属config.xml文件的示例
<slave>
<name>some_name</name>
<description/>
<remoteFS>some_value</remoteFS>
<numExecutors>xx</numExecutors>
<mode>EXCLUSIVE</mode>
<retentionStrategy class="xxxx"/>
<launcher class="xxxxx" plugin="xxxxx">
<host>xxx.x.x.xx</host>
<port>xx</port>
<credentialsId>xxxxxxx-xxx-xxxx-xxxx-xxxxxxxxxxxx</credentialsId>
<maxNumRetries>0</maxNumRetries>
<retryWaitTime>0</retryWaitTime>
<sshHostKeyVerificationStrategy class="hudson.plugins.sshslaves.verifiers.NonVerifyingKeyVerificationStrategy/></launcher>
<label>some_label</label>
</slave>
与标签类似,我还需要其他值,例如主机名,端口等。
答案 0 :(得分:2)
您可以使用.iter()
进行递归迭代以查找元素。选中the official documentation。
这里是从label
节点打印host
和slave
文本的示例。
更新:修改了code.py
,以另外打印class
标签的launcher
属性值。它使用element.attrib
获取标签的属性。可以在official documentation of parsing XML中找到更多信息。
test.xml
:
<slave>
<name>some_name</name>
<description/>
<remoteFS>some_value</remoteFS>
<numExecutors>xx</numExecutors>
<mode>xxx</mode>
<retentionStrategy class="xxxx"/>
<launcher class="xxxxx" plugin="xxxxx">
<host>xxx.x.x.xx</host>
<port>xx</port>
<credentialsId>xxxxxxxx</credentialsId>
<maxNumRetries>x</maxNumRetries>
<retryWaitTime>x</retryWaitTime>
<sshHostKeyVerificationStrategy class="hudson.plugins.sshslaves.verifiers.NonVerifyingKeyVerificationStrategy"/>
</launcher>
<label>somelabel</label>
</slave>
code.py
:
import xml.etree.ElementTree as ET
tree = ET.parse("test.xml")
root = tree.getroot()
for item in root.iter('slave'):
for label in item.iter("label"):
print label.text
for host in item.iter("host"):
print host.text
for launcher in item.iter("launcher"):
print launcher.attrib["class"]
输出:
somelabel
xxx.x.x.xx
xxxxx