我有2个数据框,其中温度(y)和比率(x)。在每个数据帧中,我有60列,分别对应于同时测量这两个参数的60台机器。
现在我对y vs x的每台计算机都有一个图,如下所示:
for column in ratio.columns:
x = ratio[column]
y = temperature[column]
if len(x) != len(y):
x_ind = x.index
y_ind = y.index
common_ind = x_ind.intersection(y_ind)
x = x[common_ind]
y = y[common_ind]
plt.scatter(x,y)
plt.savefig("plot" +column+".png")
plt.clf()
因为我有很多数据点,所以我想对每台计算机进行装仓,并对每个仓进行平均,这样我对每个仓的平均点为y。 x在0到1之间,我想每0.05装仓一次,即20仓。
我通过执行以下操作获得了每台机器的直方图: 对于x in ratio.columns: ratio.hist(column = x,bins = 20) 但这仅是事件数与比率的对比。
如何链接温度数据框 我是熊猫的新手,我不知道该怎么做
答案 0 :(得分:1)
面罩箱
mask = my_df.index//20
然后使用groupby和agg
my_df.groupby(mask).agg(['mean'])