在熊猫数据框中创建组均值列

时间:2020-07-04 14:55:20

标签: python pandas dataframe group-by

我想知道如何最好地将列添加到包含组的数据框中 手段。

这是MWE:

scenes[i] = Path.GetFileNameWithoutExtension(SceneUtility.GetScenePathByBuildIndex(i));

上面的方法可以工作,但是我很想知道是否有更好的方法。

2 个答案:

答案 0 :(得分:1)

另一种方法是将transformgroupby一起使用。还要在此处使用joinadd_suffix以获得所需的输出:

<body>
   <div id="app">
      <example-component></example-component>
   </div>

<script src="{{ asset('public/js/app.js')}}"></script>

</body>

[出]

(data.join(data.groupby('pool')[['xd1', 'xd2']]
           .transform('mean')
           .add_suffix('_mean')))

答案 1 :(得分:0)

另一种方式-calc表示然后加入。这样会生成多级列索引,并在第二行对其进行重置。

mean = data.groupby("pool").agg(["mean"]).reset_index()
mean.columns = mean.columns.map('|'.join).str.strip('|')
pd.merge(data, mean,on="pool")