我有一个大熊猫的葡萄酒数据框 - 红色和白色,包括所有的化学分析数据和最终的质量等级。
我正在尝试使用matplotlib制作一个情节"质量"作为x轴," alcohol_content"沿y轴。我的数据有"质量"收视率。我想绘制两种葡萄酒中的每种葡萄酒的平均质量评级('红色'白色',标记在列'类型' ;)找到每个质量整数的平均值,除以列'类型' ('红色'白色')。
我似乎无法正确打印。在Jupyter笔记本中运行。
以下代码:
import matplotlib
import numpy as np
import pandas as pd
matplotlib.style.use('ggplot')
df_white = pd.read_csv('data/winequality-white.csv', delimiter = ';')
df_red = pd.read_csv('data/winequality-red.csv', delimiter = ';')
cols_red = df_red.columns.tolist()
cols_red = [col.lower().replace(' ','_') for col in cols_red]
df_red.columns = cols_red
df_red['type'] = 'red'
df_white['type'] = 'white'
cols_white = df_white.columns.tolist()
cols_white = [col.lower().replace(' ','_') for col in cols_white]
df_white.columns = cols_white
combined_df = df_red
combined_df = combined_df.append(df_white)