将同一行df中具有相同索引的熊猫df合并

时间:2020-03-23 15:23:29

标签: python pandas

如果我的df看起来像这样:

               v1     v2         ...   v10       v11
id                               ...                            
102717.0   101234650  2018-08-27  ...   NaN       NaN
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018
102717.0   101234650  2018-08-27  ...   NaN       NaN
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018

因此,当id col匹配时,如何将它们合并为1行?

所需的输出将类似于:

               v1     v2         ...   v10       v11
id                               ...                            
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018

因此,脚本将检查每行重复的所有值,然后将其减少为填充所有NaN值...

1 个答案:

答案 0 :(得分:0)

这实际上取决于结果。例如。 v2是否始终为相同的ID包含相同的日期?根据我想您要尝试做的事情,我会执行以下操作:

mean_dict = dict((el, np.nanmean) for el in df.columns)
newdf = df.groupby('id').agg(mean_dict)

我希望能有所帮助。有了您的输入和所需输出的更多详细信息,我们也许可以为您提供更好的帮助。