将返回的XML数据放入dict是一种简单快捷的方法吗?

时间:2010-04-04 19:48:52

标签: python xml dictionary xml-parsing

我正在尝试从以下位置返回数据:

http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true

以快速简便的方式进入一个词典。最好的方法是什么?

感谢。

3 个答案:

答案 0 :(得分:8)

使用标准Python库中的xml

import xml.etree.ElementTree as xee
contents='''\
<?xml version="1.0" encoding="UTF-8"?>
<Response>
  <Ip>74.125.45.100</Ip>
  <Status>OK</Status>
  <CountryCode>US</CountryCode>
  <CountryName>United States</CountryName>
  <RegionCode>06</RegionCode>
  <RegionName>California</RegionName>
  <City>Mountain View</City>
  <ZipPostalCode>94043</ZipPostalCode>
  <Latitude>37.4192</Latitude>
  <Longitude>-122.057</Longitude>
  <TimezoneName>America/Los_Angeles</TimezoneName>
  <Gmtoffset>-25200</Gmtoffset>
  <Isdst>1</Isdst>
</Response>'''

doc=xee.fromstring(contents)
print dict(((elt.tag,elt.text) for elt in doc))

或使用lxml

import lxml.etree
import urllib2
url='http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true'
doc = lxml.etree.parse( urllib2.urlopen(url) ).getroot()
print dict(((elt.tag,elt.text) for elt in doc))

答案 1 :(得分:2)

我会使用xml.dom内置,如下所示:

import urllib
from xml.dom import minidom

data = urllib.urlopen('http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true')
xml_data = minidom.parse(data)
my_dict ={}
for node in xml_data.getElementsByTagName('Response')[0].childNodes:
    if node.nodeType != minidom.Node.TEXT_NODE:
        my_dict[node.nodeName] = node.childNodes[0].data

答案 2 :(得分:0)

从python2.5开始,标准库中的

xml.etree。同时查看具有相同界面的lxml。我并没有“潜入”,但我认为this is also applicable to python >= 2.5 too

修改

这是解析xml的一种快速而简单的方法,不要将数据真正地放到dict中,但api非常直观。