我有一个已连接索引的列表:
[{0,1}, {2,3},....., {69, 31, 15}] each element can be of variable length
我想使用这些索引将这些索引处的行合并到另一个数据帧df中,例如:
_id fName lName age
0 ABCD Andrew Schulz
1 ABCD Andreww 23
2 DEFG John boy
3 DEFG Johnn boy 14
4 CDGH Bob TANNA 13
5 ABCD. Peter Parker 45
6 DEFGH Clark Kent 25
成为
_id fName lName age
0 ABCD Andrew Schulz 23
2 DEFG John boy 14
4 CDGH Bob TANNA 13
5 ABCD Peter Parker 45
6 DEFG Clark Kent 25
不复杂。让我们为所有行都有数据的列取第一行的值。但是,无论哪里缺失,如果存在该数据,我都希望从其他列中得出。
答案 0 :(得分:0)
要从每个组中获取第一个值,您可以执行以下操作:
df = df.groupby(by=['_id'], as_index=False).first()
print(df)
_id fName lName age
0 ABCD Andrew Schulz NaN
1 CDGH Bob TANNA 13.0
2 DEFG John boy 14.0
如果第一个值为Null或NaN,是否要从另一行获取值?