我正在尝试从在线来源访问xml文件(实际上很多)。我有一个代码可以做到,但我安装了一个新的操作系统,忘了备份我的phython脚本:(
我只是试图访问xml,一旦我有了数据,我相信我记得我是如何解析它的。我只是不记得我是如何访问它的。我一直在环顾四周,所有我能找到的东西都在urllib中,但当我尝试提出请求时,由于网址中的“:”,它不会运行脚本。任何帮助?
这是我正在尝试访问的xml地址之一。 http://api.eve-central.com/api/marketstat?typeid=34®ionlimit=10000002
答案 0 :(得分:0)
您正在寻找urllib2库。
http://docs.python.org/2/howto/urllib2.html
简而言之,这就是你如何使用它
url_response = urllib2.urlopen(url) ## return a http.response object
xml_content = url_response.read() ## read the content
此外,我使用beautifulsoup4从xml doc http://www.crummy.com/software/BeautifulSoup/bs4/doc/中提取数据。
简而言之,
from bs4 import BeautifulSoup ## import bs4 as BeautifulSoup
content = BeautifulSoup(xml_content) ## convert xml content to beautifulsoup object
span = content.find_all("span") ## find all span tag and return as list
振作!