我正在尝试从以下位置返回数据:
http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true
以快速简便的方式进入一个词典。最好的方法是什么?
感谢。
答案 0 :(得分:8)
使用标准Python库中的xml
:
import xml.etree.ElementTree as xee
contents='''\
<?xml version="1.0" encoding="UTF-8"?>
<Response>
<Ip>74.125.45.100</Ip>
<Status>OK</Status>
<CountryCode>US</CountryCode>
<CountryName>United States</CountryName>
<RegionCode>06</RegionCode>
<RegionName>California</RegionName>
<City>Mountain View</City>
<ZipPostalCode>94043</ZipPostalCode>
<Latitude>37.4192</Latitude>
<Longitude>-122.057</Longitude>
<TimezoneName>America/Los_Angeles</TimezoneName>
<Gmtoffset>-25200</Gmtoffset>
<Isdst>1</Isdst>
</Response>'''
doc=xee.fromstring(contents)
print dict(((elt.tag,elt.text) for elt in doc))
或使用lxml
:
import lxml.etree
import urllib2
url='http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true'
doc = lxml.etree.parse( urllib2.urlopen(url) ).getroot()
print dict(((elt.tag,elt.text) for elt in doc))
答案 1 :(得分:2)
我会使用xml.dom内置,如下所示:
import urllib
from xml.dom import minidom
data = urllib.urlopen('http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true')
xml_data = minidom.parse(data)
my_dict ={}
for node in xml_data.getElementsByTagName('Response')[0].childNodes:
if node.nodeType != minidom.Node.TEXT_NODE:
my_dict[node.nodeName] = node.childNodes[0].data
答案 2 :(得分:0)
xml.etree
。同时查看具有相同界面的lxml
。我并没有“潜入”,但我认为this is also applicable to python >= 2.5 too。
修改强>
这是解析xml的一种快速而简单的方法,不要将数据真正地放到dict中,但api非常直观。