使用python从URL / XML读取数据

时间:2019-10-06 20:16:16

标签: python python-3.x url

这是我的第一个问题。 我正在尝试学习一些python,所以..我遇到了这个问题

我如何从该网址获取以XML格式显示信息的数据:

import requests
from bs4 import BeautifulSoup
url = 'http://windte1910.acepta.com/v01/A23D046FC1854B18399D5383F36923E25774179C?k=5121f909fd63e674149c0e42a9847b49'
document = requests.get(url)
soup = BeautifulSoup(document.content, "lxml-xml")
print(soup)

输出:

Output

但是我想访问这种类型的数据,例如数据:

linkurl_invoice

希望您可以尝试提供有关代码以及如何阅读xml文档的建议。

1 个答案:

答案 0 :(得分:0)

通过检查您提供的URL,似乎数据实际上已保存在以下URL的几个链接之外:http://windte1910.acepta.com/depot/A23D046FC1854B18399D5383F36923E25774179C?k=5121f909fd63e674149c0e42a9847b49

这样,您可以按以下方式直接访问它:

import requests
from bs4 import BeautifulSoup
url = 'http://windte1910.acepta.com/depot/A23D046FC1854B18399D5383F36923E25774179C?k=5121f909fd63e674149c0e42a9847b49'
document = requests.get(url)
soup = BeautifulSoup(document.content, "lxml-xml")

print(soup.find('RUTEmisor').text)