我试图在python中使用xml.etree.ElementTree,但它适用于示例代码,但不适用于我的其他代码。
例: XML文件:程序使用这个XML文件正常工作:
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank>1</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank>4</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank>68</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
计划:
import xml.etree.ElementTree as ET
tree = ET.parse('country.xml')
root = tree.getroot()
for page in root.findall('country'):
print("inside")
输出:
inside
inside
inside
这不适用于以下计划:
XML文件: ** 计划未使用以下XML文件 **
<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.8/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.8/ http://www.mediawiki.org/xml/export-0.8.xsd" version="0.8" xml:lang="en">
<siteinfo>
<sitename>Wikipedia</sitename>
<base>http://en.wikipedia.org/wiki/Main_Page</base>
<generator>MediaWiki 1.23wmf11</generator>
<case>first-letter</case>
<namespaces>
<namespace key="-2" case="first-letter">Media</namespace>
</namespaces>
</siteinfo>
<page>
<title>Affirming the consequent</title>
<ns>0</ns>
<id>675</id>
</page>
</mediawiki>
代码:
import xml.etree.ElementTree as ET
tree = ET.parse('sample.xml')
root = tree.getroot()
for page in root.findall('page'):
print("inside")
输出:No Output.
我发现原因是由mediawiki
标记中的属性引起的。但我无法在样本数据中避免使用该标记。有没有办法让这项工作。
答案 0 :(得分:0)
试试这个......
for page in root.findall('{mediawiki.org/xml/export-0.8}page'):
print(page)