Pandas缺失值:填充最接近的非NaN值

时间:2017-06-27 14:27:36

标签: python pandas time-series nan fillna

假设我有一个连续几个NaN的熊猫系列。我知道fillna有几种方法可以填充缺失值(backfillfill forward),但我想用最接近的非NaN值填充它们。这是我所拥有的一个例子:

`s = pd.Series([0, 1, np.nan, np.nan, np.nan, np.nan, 3])`

我想要的一个例子:     s = pd.Series([0, 1, 1, 1, 3, 3, 3])

有谁知道我能做到吗?

谢谢!

1 个答案:

答案 0 :(得分:12)

您可以将Series.interpolatemethod='nearest'

一起使用
In [11]: s = pd.Series([0, 1, np.nan, np.nan, np.nan, np.nan, 3])

In [12]: s.interpolate(method='nearest')
Out[12]: 
0    0.0
1    1.0
2    1.0
3    1.0
4    3.0
5    3.0
6    3.0
dtype: float64

In [13]: s = pd.Series([0, 1, np.nan, np.nan, 2, np.nan, np.nan, 3])

In [14]: s.interpolate(method='nearest')
Out[14]: 
0    0.0
1    1.0
2    1.0
3    2.0
4    2.0
5    2.0
6    3.0
7    3.0
dtype: float64