使用lxml python的xml解析器问题

时间:2018-04-23 15:25:17

标签: python xml lxml

我正在使用服务器特定数据,并希望在我的xml文件中解析数据“measTypes”。因为我的xml文件(命名空间)中的一些头数据,我无法解析数据,我的代码失败,你能帮我在我的xml数据中获取“measTypes”吗?

我正在使用下面的代码,但它失败了因为measInfo没有值:

from lxml import etree
tree = etree.parse(open("BLRNCH03.xml"))
measInfo = tree.xpath('//measInfo[@measInfoId="67109488"]')[0]
print(measInfo)

这是我的xml数据:

<?xml version="1.0" encoding="UTF-8"?>
<measCollecFile xmlns="http://latest/nmc-omc/cmNrm.doc#measCollec" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://latest/nmc-omc/cmNrm.doc#measCollec schema\pmResultSchedule.xsd">
    <fileHeader fileFormatVersion="32.435 V7.2" vendorName="Huawei">
        <fileSender elementType="BSC6910 UMTS"/>
        <measCollec beginTime="2018-04-22T00:00:00+04:30"/>
    </fileHeader>
    <measData>
    <measInfo measInfoId="67109481">
        <measTypes>67194793 67194794 67194795 67194796 </measTypes>
    </measInfo>
    <measData>
    <fileFooter>
        <measCollec endTime="2018-04-22T01:00:00+04:30"/>
    </fileFooter>
</measCollecFile>

1 个答案:

答案 0 :(得分:3)

只需bind the default namespace to a prefix并在.xpath()来电中使用它。

我使用了前缀mc,但你可以使用不同的东西。

示例...

from lxml import etree

namespaces = {"mc": "http://latest/nmc-omc/cmNrm.doc#measCollec"}

tree = etree.parse("BLRNCH03.xml")
measTypes = tree.xpath("//mc:measInfo[@measInfoId='67109481']/mc:measTypes", 
                      namespaces=namespaces)[0]

print(measTypes)

这将打印如下内容:

<Element {http://latest/nmc-omc/cmNrm.doc#measCollec}measTypes at 283e638>