Question

如果我的df看起来像这样：

               v1     v2         ...   v10       v11
id                               ...                            
102717.0   101234650  2018-08-27  ...   NaN       NaN
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018
102717.0   101234650  2018-08-27  ...   NaN       NaN
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018

因此，当id col匹配时，如何将它们合并为1行？

所需的输出将类似于：

               v1     v2         ...   v10       v11
id                               ...                            
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018

因此，脚本将检查每行重复的所有值，然后将其减少为填充所有NaN值...

Answer 1

这实际上取决于结果。例如。 v2是否始终为相同的ID包含相同的日期？根据我想您要尝试做的事情，我会执行以下操作：

mean_dict = dict((el, np.nanmean) for el in df.columns)
newdf = df.groupby('id').agg(mean_dict)

我希望能有所帮助。有了您的输入和所需输出的更多详细信息，我们也许可以为您提供更好的帮助。

将同一行df中具有相同索引的熊猫df合并

1 个答案: