我有一个超过260万行的数据集。我需要修改其中一列。此特定列在一行中显示字符串值,然后在显示另一个字符串值后,在接下来的100行中显示NaN值。请参阅下面的样本数据集以供参考:
x=pd.DataFrame({'Date':[1,2,3,4,5,6,7,8,9,10],'Fund':['a',np.nan,np.nan,np.nan,'b',np.nan,np.nan,'c',np.nan,np.nan],'value':[1,2,3,4,5,6,7,8,9,10]})
Date Fund value
0 1 a 1
1 2 NaN 2
2 3 NaN 3
3 4 NaN 4
4 5 b 5
5 6 NaN 6
6 7 NaN 7
7 8 c 8
8 9 NaN 9
9 10 NaN 10
如上面的示例所示,在出现字符串之前,“ Fund”列具有多个NaN值。我要用上面的字符串替换NaN值。因此,最终答案变为:
Date Fund value
0 1 a 1
1 2 a 2
2 3 a 3
3 4 a 4
4 5 b 5
5 6 b 6
6 7 b 7
7 8 c 8
8 9 c 9
9 10 c 10
如果有人可以帮助我,我将不胜感激。