通过在pandas数据帧中从所有这些行中获取非NaN来合并相同索引的行

时间:2016-05-18 10:57:56

标签: python pandas dataframe

我有一个带有重复索引的稀疏数据框。如何以一种方式合并相同的索引行,以便从冲突的行中保留所有非NaN数据

我知道您可以通过内置MyDataStructure功能实现非常接近的功能,但您只能保留第一个最后一个行使用相同的索引:

drop_duplicates

我需要的是来自任何冲突行的所有非纳米值

在:

DataFrame with A,B,C,D columns, and 1,2,2,3,4,5 rows. In the first 2-indexed row there is a 2.0 in the B column, in the second, there is a 3.0 in the D column.

后:

enter image description here

1 个答案:

答案 0 :(得分:0)

df.reset_index().drop_duplicates(subset='index', keep='first').set_index('index').sort_index()

这将从冲突的行中选择非NaN值。或者,如果同一列的多个冲突行中存在值,则为最大值。