来自Pandas DF的Matplotlib中的多个类别的散点图

时间:2017-02-22 05:44:35

标签: python pandas matplotlib plot data-science

我有一个大熊猫的葡萄酒数据框 - 红色和白色,包括所有的化学分析数据和最终的质量等级。

我正在尝试使用matplotlib制作一个情节"质量"作为x轴," alcohol_content"沿y轴。我的数据有"质量"收视率。我想绘制两种葡萄酒中的每种葡萄酒的平均质量评级('红色'白色',标记在列'类型' ;)找到每个质量整数的平均值,除以列'类型' ('红色'白色')。

我似乎无法正确打印。在Jupyter笔记本中运行。

以下代码:

    import matplotlib
    import numpy as np
    import pandas as pd

    matplotlib.style.use('ggplot')


    df_white = pd.read_csv('data/winequality-white.csv', delimiter = ';')
    df_red = pd.read_csv('data/winequality-red.csv', delimiter = ';')

    cols_red = df_red.columns.tolist()
    cols_red = [col.lower().replace(' ','_') for col in cols_red]
    df_red.columns = cols_red

    df_red['type'] = 'red'
    df_white['type'] = 'white'

    cols_white = df_white.columns.tolist()
    cols_white = [col.lower().replace(' ','_') for col in cols_white]
    df_white.columns = cols_white

    combined_df = df_red
    combined_df = combined_df.append(df_white)

0 个答案:

没有答案