如果我的数据是:
a=pd.DataFrame({'Array1':[None,1,2,None,3,None,4,5,6,None]})
我想填写缺少的值,以便数据为:
1,1,2,2.5,3,3.5,4,5,6,6
您可以看到第一个缺失值被填充为1,因为第二个值是1,这是最接近的值。最后一个值丢失了。我填写6是因为最接近的是6。然后,我使用(2 + 3)/2=2.5填写第四个缺失值,即前一个值和后一个值的平均值。
我不知道Python是否具有执行此操作的功能?如果是这样,有人可以给我一些建议吗?
答案 0 :(得分:2)
使用interpolate
a.interpolate(method ='linear',limit_direction ='both')
Out[502]:
Array1
0 1.0
1 1.0
2 2.0
3 2.5
4 3.0
5 3.5
6 4.0
7 5.0
8 6.0
9 6.0