如何获得直接子节点而不是具有相同标签名称xml minidom python的子子节点

时间:2014-05-20 12:08:48

标签: python xml python-2.7 xml-parsing minidom

我使用xml minidom从xml文件中获取一些数据但无法获得所需结果...尝试从x2 minidom相关的此站点的许多代码但是失败..这是我的示例xml文件..

<computer>
    <parts>
        <text>Required</text>
    </parts>
    <parts>
        <text>Required</text>
        <parts>
            <text>?Not Required</text>
        </parts>
        <parts>
            <text>?Not Required</text>
        </parts>
    </parts>
    <parts>
        <text>Required</text>
        <parts>
            <text>Not Required</text>
        </parts>
    </parts>
    <parts>
        <text>Required</text>
   </parts>
</computer>

我希望得到“必需”的文字但是得到那样的输出

Required
Required
Not Required
Not Required
Required
Not Required
Required

这是我的代码示例,它从文件中获取所有文本但我需要在父标记的直接子标记内的文本...

from xml.dom import minidom
file=('d:\sample.xml')
xmldoc=minidom.parse(file)
parentnode = xmldoc.getElementsByTagName('computer')
for node in parentnode:
    alist=node.getElementsByTagName('text')
    for a in alist:
        t=a.childNodes[0].nodeValue
        print authortext

我想要的输出

Required
Required
Required
Required

1 个答案:

答案 0 :(得分:2)

除非您的实际XML更复杂,否则您可以导航DOM树并从text节点中的parts个子节点获取所需的子节点,这些节点是computer的子节点:

import xml.dom.minidom

file=('sample.xml')
xmldoc=xml.dom.minidom.parse(file)
computerNode = xmldoc.getElementsByTagName('computer')
for computerChild in computerNode:
    for parts in computerChild.childNodes:
       for partsChild in parts.childNodes:
          if partsChild.nodeType == xml.dom.Node.ELEMENT_NODE: 
             if partsChild.tagName == 'text':
                print partsChild.childNodes[0].nodeValue

要使用XPath,正如我之前建议的那样,以及更简单的DOM导航,最好使用Element Tree API