改进从python中的表中抓取数据的代码

时间:2017-03-30 18:35:06

标签: python html web-scraping

使用BeautifulSoup我设法从网页上获取所有标签的数据,但没有它们我的工作很差。

我正试图从以下方式获得美元汇率: http://www.bancochile.cl/cgi-bin/cgi_mone?pagina=inversiones/mon_tasa/cgi_mone

以下黄色后突出显示该值:

image

经过大量的反复试验,我设法获得美元汇率,但我认为必须有更好的方法。

import requests
from bs4 import BeautifulSoup

page = requests.get("http://www.bancochile.cl/cgi-bin/cgi_mone?pagina=inversiones/mon_tasa/cgi_mone")
soup = BeautifulSoup(page.content, 'html.parser')

tables = soup.find_all("table")
dollar = tables[4].find_all("td")

print(dollar[5].string)

有更好或更正确的方法吗?

此外,我不确定问题是否与我编码的方式有关,或者无法更好地理解html结构,以更有效的方式导航到信息。

0 个答案:

没有答案