我有一个带有重复索引的稀疏数据框。如何以一种方式合并相同的索引行,以便从冲突的行中保留所有非NaN数据?
我知道您可以通过内置MyDataStructure
功能实现非常接近的功能,但您只能保留第一个或最后一个行使用相同的索引:
drop_duplicates
我需要的是来自任何冲突行的所有非纳米值。
在:
后:
答案 0 :(得分:0)
df.reset_index().drop_duplicates(subset='index', keep='first').set_index('index').sort_index()
这将从冲突的行中选择非NaN值。或者,如果同一列的多个冲突行中存在值,则为最大值。