我必须在数据集子组中找到2个指标的平均值与原始组相似的子组。
例如,我想找到一个average(metric 1) = 10
和average(metric 2) = 5
最近的城市或一组城市。
数据集示例:
我该怎么办?
答案 0 :(得分:2)
仅按城市分组,然后按结束值排序(我刚刚添加了两个指标列,希望可以,因为我没有详细说明什么指标)
df2 = df.groupby(['city']).mean()
input1 = 10
input2 = 5
df_sort = df2.iloc[((df2['metric 1']-input1)+(df2['metric 2']-input2)).abs().argsort()]