如果我的df看起来像这样:
v1 v2 ... v10 v11
id ...
102717.0 101234650 2018-08-27 ... NaN NaN
102717.0 101234650 2018-08-27 ... UDMS 27/08/2018
102717.0 101234650 2018-08-27 ... NaN NaN
102717.0 101234650 2018-08-27 ... UDMS 27/08/2018
因此,当id col匹配时,如何将它们合并为1行?
所需的输出将类似于:
v1 v2 ... v10 v11
id ...
102717.0 101234650 2018-08-27 ... UDMS 27/08/2018
因此,脚本将检查每行重复的所有值,然后将其减少为填充所有NaN值...
答案 0 :(得分:0)
这实际上取决于结果。例如。 v2是否始终为相同的ID包含相同的日期?根据我想您要尝试做的事情,我会执行以下操作:
mean_dict = dict((el, np.nanmean) for el in df.columns)
newdf = df.groupby('id').agg(mean_dict)
我希望能有所帮助。有了您的输入和所需输出的更多详细信息,我们也许可以为您提供更好的帮助。