尝试多索引数据框,我的数据框(名为摘要)具有7个不同的索引,其中第四个是Temperature。我的数据是['mean','std','count']:
Result value mean std count Ind0 Ind1 Ind2 Temp Ind4 Ind5 Ind6 V1 1 4.0 70 -1 S11 T40 40.2 2.1 2 50 -1 S11 T40 20.6 0.5 2 20 -1 S11 T40 34.1 1.4 2
对于其他索引匹配的每种情况,我使用groupby进行以下操作,使用添加到每个数据点的参考温度的结果(然后可以删除参考行上的内容):
for ind, temp_summary in summary.groupby(level=[0,1,2,4,5,6]): temp_summary.loc[['ref_mean','ref_std','ref_count']]=temp_summary.loc[ref_temp,['mean','std','count']] print(ind, temp_summary)
但是,由于ref_temp不在索引中,我得到了一个错误,这是有道理的,因为并非所有匹配的实例在ref_temp都有一个数据点,但是我不知道如何解决这个问题,而只对那些实例执行操作有参考。
所以我实际上在这里有三个问题,是这个问题的新手:
当然,我的总体方法可能不是最好的,我应该使用更好的方法。如果有多种可行的方法可以做到这一点,则最快的方法(从计算角度而言)将是首选,因为时间是此应用程序中的一个问题。