我有一个名为“ df”的熊猫数据框。它的列是ID,年龄和性别。
缺少一些“年龄”。如果缺少年龄,则需要使用上一列中的值填写。
例如,id 20的年龄必须为33.0,id 50的年龄必须为45.0。我如何使用Apply来做到这一点。 (我知道可以使用iloc / loc / iterrows来完成。但是我正在寻找使用Apply解决的问题)
d = {'id': [10,20,30,40,50],'sex':['M','M','F','M','M'] ,'age': [33,np.nan,24,45,np.nan]}
df = pd.DataFrame(data=d)
df.set_index('id')
id age sex
10 33.0 M
20 NaN M
30 24.0 F
40 45.0 M
50 NaN M
=====预期结果===
id age sex
10 33.0 M
20 33.0 M
30 24.0 F
40 45.0 M
50 45.0 M