无法在python中使用xml.etree.ElementTree

时间:2014-02-22 03:23:25

标签: xml python-3.x xml-parsing

我试图在python中使用xml.etree.ElementTree,但它适用于示例代码,但不适用于我的其他代码。

例: XML文件:程序使用这个XML文件正常工作:

<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank>1</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank>4</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank>68</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

计划:

import xml.etree.ElementTree as ET
tree = ET.parse('country.xml')
root = tree.getroot()
for page in root.findall('country'):
    print("inside")

输出:

inside
inside
inside

这不适用于以下计划:

XML文件: ** 计划未使用以下XML文件 **

<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.8/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.8/ http://www.mediawiki.org/xml/export-0.8.xsd" version="0.8" xml:lang="en">
  <siteinfo>
    <sitename>Wikipedia</sitename>
    <base>http://en.wikipedia.org/wiki/Main_Page</base>
    <generator>MediaWiki 1.23wmf11</generator>
    <case>first-letter</case>
    <namespaces>
      <namespace key="-2" case="first-letter">Media</namespace>
    </namespaces>
  </siteinfo>
  <page>
    <title>Affirming the consequent</title>
    <ns>0</ns>
    <id>675</id>
  </page>
</mediawiki>

代码:

import xml.etree.ElementTree as ET
tree = ET.parse('sample.xml')
root = tree.getroot()
for page in root.findall('page'):
    print("inside")

输出:No Output.

我发现原因是由mediawiki标记中的属性引起的。但我无法在样本数据中避免使用该标记。有没有办法让这项工作。

1 个答案:

答案 0 :(得分:0)

试试这个......

for page in root.findall('{mediawiki.org/xml/export-0.8}page'):
    print(page)