从数据框中删除标签(<td>,<tr>和<p>,然后导出到csv并通过电子邮件发送

时间:2019-11-03 17:20:25

标签: python-3.x dataframe tags export-to-excel

我是一个学习中的,沮丧的python新手!我正在尝试从我们学校的网站中提取足球成绩并将其通过电子邮件发送给父母名单,以便他们可以随时了解球队的进展情况。我创建了一个数据框并尝试导出,但是所有标签都通过了并且数据混乱了。我什至没有发电子邮件出去,但是会尝试在下一步中学习。感谢您提供的所有帮助!

from bs4 import BeautifulSoup
import requests
import csv
import pandas as pd


url = "https://southkentschool.org/athletics/teams/varsity-soccer/schedule-scores"
html_content = requests.get(url).text

soup = BeautifulSoup(html_content, "lxml")

data_source = soup.find("div", attrs={"class": "ss-content-block"})
data_table = data_source.tbody.find_all("tr")  
print(type(data_table))
print(data_table)

df = pd.DataFrame(data_table)
print(df)
export_csv = df.to_csv (r'export_dataframe.csv', index = None, header=True) 

0 个答案:

没有答案