Question

这是我的第一个问题。我正在尝试学习一些python，所以..我遇到了这个问题

我如何从该网址获取以XML格式显示信息的数据：

import requests
from bs4 import BeautifulSoup
url = 'http://windte1910.acepta.com/v01/A23D046FC1854B18399D5383F36923E25774179C?k=5121f909fd63e674149c0e42a9847b49'
document = requests.get(url)
soup = BeautifulSoup(document.content, "lxml-xml")
print(soup)

输出：

Output

但是我想访问这种类型的数据，例如数据：

linkurl_invoice

希望您可以尝试提供有关代码以及如何阅读xml文档的建议。

Answer 1

通过检查您提供的URL，似乎数据实际上已保存在以下URL的几个链接之外：http://windte1910.acepta.com/depot/A23D046FC1854B18399D5383F36923E25774179C?k=5121f909fd63e674149c0e42a9847b49

这样，您可以按以下方式直接访问它：

import requests
from bs4 import BeautifulSoup
url = 'http://windte1910.acepta.com/depot/A23D046FC1854B18399D5383F36923E25774179C?k=5121f909fd63e674149c0e42a9847b49'
document = requests.get(url)
soup = BeautifulSoup(document.content, "lxml-xml")

print(soup.find('RUTEmisor').text)

使用python从URL / XML读取数据

1 个答案: