从网页

时间:2018-03-08 12:06:06

标签: python html python-3.x beautifulsoup

我正在开展一个自动化项目,我需要具体来自此页面的历史汇率 - http://bnro.ro/files/xml/nbrfxrates2017.htm,以及其他与此类似的不同年份。

问题是BS似乎无法工作,因为表是从XML文件加载的。 Selenium不是一个选项,因为我们需要程序在后台运行(除非有可能是selenium),也不是Forex模块,因为速率略有不同。

是否可以从此表或XML文件中获取数据?或者我是否必须向他们询问档案?

1 个答案:

答案 0 :(得分:2)

正如您所说,数据是从XML文件加载的。如果您查看开发人员工具中的Network标签,则可以通过向此网站发送请求来查看XML文件 - http://bnro.ro/files/xml/years/nbrfxrates2017.xml

您可以使用此网址使用requests模块获取数据。

import requests

r = requests.get('http://bnro.ro/files/xml/years/nbrfxrates2017.xml')
print('2017-01-03' in r.text)  # To check whether successful.
# True