每个大熊猫的平均分数

时间:2019-07-13 20:50:49

标签: python pandas

我有2个数据框,其中温度(y)和比率(x)。在每个数据帧中,我有60列,分别对应于同时测量这两个参数的60台机器。

现在我对y vs x的每台计算机都有一个图,如下所示:

for column in ratio.columns:
    x = ratio[column]
    y = temperature[column]

    if len(x) != len(y):
        x_ind = x.index
        y_ind = y.index
        common_ind = x_ind.intersection(y_ind)
        x = x[common_ind]
        y = y[common_ind]

    plt.scatter(x,y)
    plt.savefig("plot" +column+".png")
    plt.clf()

因为我有很多数据点,所以我想对每台计算机进行装仓,并对每个仓进行平均,这样我对每个仓的平均点为y。 x在0到1之间,我想每0.05装仓一次,即20仓。

我通过执行以下操作获得了每台机器的直方图:         对于x in ratio.columns:         ratio.hist(column = x,bins = 20) 但这仅是事件数与比率的对比。

如何链接温度数据框 我是熊猫的新手,我不知道该怎么做

1 个答案:

答案 0 :(得分:1)

每20个

面罩箱

mask = my_df.index//20

然后使用groupby和agg

my_df.groupby(mask).agg(['mean'])