Question

我正在尝试从在线来源访问xml文件（实际上很多）。我有一个代码可以做到，但我安装了一个新的操作系统，忘了备份我的phython脚本：（

我只是试图访问xml，一旦我有了数据，我相信我记得我是如何解析它的。我只是不记得我是如何访问它的。我一直在环顾四周，所有我能找到的东西都在urllib中，但当我尝试提出请求时，由于网址中的“：”，它不会运行脚本。任何帮助？

这是我正在尝试访问的xml地址之一。 http://api.eve-central.com/api/marketstat?typeid=34&regionlimit=10000002

Answer 1

您正在寻找urllib2库。

http://docs.python.org/2/howto/urllib2.html

简而言之，这就是你如何使用它

url_response = urllib2.urlopen(url) ## return a http.response object 
xml_content = url_response.read() ## read the content

此外，我使用beautifulsoup4从xml doc http://www.crummy.com/software/BeautifulSoup/bs4/doc/中提取数据。

简而言之，

from bs4 import BeautifulSoup           ## import bs4 as BeautifulSoup
content = BeautifulSoup(xml_content)    ## convert xml content to beautifulsoup object 
span = content.find_all("span")         ## find all span tag and return as list

振作！

使用python访问在线xml

1 个答案: