合并行数据以获取pandas数据框中的给定索引列表

时间:2020-06-28 13:18:21

标签: python pandas

我有一个已连接索引的列表:

[{0,1}, {2,3},....., {69, 31, 15}] each element can be of variable length

我想使用这些索引将这些索引处的行合并到另一个数据帧df中,例如:

         _id      fName        lName    age
0       ABCD     Andrew       Schulz    
1       ABCD    Andreww                  23
2       DEFG       John          boy
3       DEFG      Johnn          boy     14
4       CDGH        Bob        TANNA     13
5       ABCD.     Peter        Parker    45
6       DEFGH     Clark          Kent    25

成为

         _id      fName        lName   age
0       ABCD     Andrew       Schulz    23
2       DEFG       John          boy    14
4       CDGH        Bob        TANNA    13
5       ABCD      Peter       Parker    45
6       DEFG      Clark         Kent    25

不复杂。让我们为所有行都有数据的列取第一行的值。但是,无论哪里缺失,如果存在该数据,我都希望从其他列中得出。

1 个答案:

答案 0 :(得分:0)

要从每个组中获取第一个值,您可以执行以下操作:

df = df.groupby(by=['_id'], as_index=False).first()
print(df)

    _id   fName   lName   age
0  ABCD  Andrew  Schulz   NaN
1  CDGH     Bob   TANNA  13.0
2  DEFG    John     boy  14.0

如果第一个值为Null或NaN,是否要从另一行获取值?