如何从具有奇怪DTD的URL请求HTML文件?

时间:2019-05-31 08:12:40

标签: python html pandas parsing beautifulsoup

我想按日期从下面的URL中提取所有相关信息。 日期从2009年1月1日开始至今。 信息是诸如日期,RS / USD,35.4049、35.4929等的内容...

我希望按日期在熊猫数据框中显示所有这些类型的数据

import pandas as pd
import arrow
import numpy as np
import matplotlib.pyplot as plt
import re
from bs4 import BeautifulSoup
from urllib.request import urlopen
import requests

url ="https://www.bom.mu/dealth-rate/downloadALL?field_dealing_date_value%5Bvalue%5D%5Bdate%5D=01-01-2009"


r = requests.get(url, allow_redirects=True) 
#open('google.ico', 'wb').write(r.content)

html_doc = r.content
html = BeautifulSoup(html_doc, 'lxml')

你能帮我吗?

0 个答案:

没有答案