Question

我有一个带有重复索引的稀疏数据框。如何以一种方式合并相同的索引行，以便从冲突的行中保留所有非NaN数据？

我知道您可以通过内置MyDataStructure功能实现非常接近的功能，但您只能保留第一个或最后一个行使用相同的索引：

drop_duplicates

我需要的是来自任何冲突行的所有非纳米值。

在：

后：

Answer 1

df.reset_index().drop_duplicates(subset='index', keep='first').set_index('index').sort_index()

这将从冲突的行中选择非NaN值。或者，如果同一列的多个冲突行中存在值，则为最大值。