我对pandas.interpolate
有点陌生。
我有一个熊猫数据帧,从2011年到2017年以年为索引。有时我缺少值,所以我使用了method='linear'
和limit_direction='both'
进行插值来填补空白。
下面的屏幕快照显示原始数据帧(顶部)和插值结果(底部)。
当缺失值位于非缺失值之间时,一切正常:在下面的示例中,2016年产生了一个全新的值。
但是当NA在系列的开始或结尾时,我对结果不满意,因为事实证明,它仅仅是下一个非缺失值的复制品:在下面的示例中,您可以看到2011和2012与2013具有相同的值。
然后,我尝试将method='polynomial'
与order=2
一起使用,以获得“平滑”插值,但是出现以下错误:
ValueError: number of derivatives at boundaries.
有人可以向我解释为什么我做错了,我可以使用哪种方法获得良好的插值,包括第一个和最后一个值?