我如何从不同的群体获得相似的分布?

时间:2019-02-19 13:14:15

标签: python pandas statistics data-science

我必须在数据集子组中找到2个指标的平均值与原始组相似的子组。

例如,我想找到一个average(metric 1) = 10average(metric 2) = 5最近的城市或一组城市。

数据集示例:

enter image description here

我该怎么办?

1 个答案:

答案 0 :(得分:2)

仅按城市分组,然后按结束值排序(我刚刚添加了两个指标列,希望可以,因为我没有详细说明什么指标)

df2 = df.groupby(['city']).mean()

input1 = 10
input2 = 5

df_sort = df2.iloc[((df2['metric 1']-input1)+(df2['metric 2']-input2)).abs().argsort()]