如何用熊猫系列中的日期替换日期列中的NaT?

时间:2020-04-02 13:15:39

标签: python pandas

我有一个df,如下所示:

dates   values
2020-12-31 23:45:00 75.6
2021-01-01 00:00:00 74.7
 NaT                73.7
 NaT                72.3
 NaT                70.5
 NaT                68.2

我要用我制作的如下序列替换NaT值:

oct_two_am = datetime.datetime(2020, 10, 25, 2, 0)
oct_three_am = datetime.datetime(2020, 10, 25, 3, 0)

# generates 15mins data
oct_dls = pd.date_range(start=oct_two_am, end=oct_three_am, freq='15min', closed='left')
oct_dls = oct_dls.to_series().reset_index(drop=True)

这给了我以下系列oct_dls

oct_dls
Out[26]: 
0   2020-10-25 02:00:00
1   2020-10-25 02:15:00
2   2020-10-25 02:30:00
3   2020-10-25 02:45:00
dtype: datetime64[ns]

现在,我想用数据集NaTs中的值替换数据帧df中的oct_dls

我尝试过:

df['dates'] = df['dates'].fillna(value=oct_dls)

但这不起作用。

感谢您的帮助。谢谢

2 个答案:

答案 0 :(得分:5)

由于索引不匹配,这就是为什么无法填充空值的原因。

index匹配是熊猫分配中的隐藏键之一。

oct_dls.index=df.index[df['dates'].isnull()]
df['dates'] = df['dates'].fillna(value=oct_dls)

答案 1 :(得分:4)

如果缺失值的长度与DatetimeIndex的新值数匹配,请使用BooleanToVisibilityConverter并按DataFrame.loc进行过滤,这样可以简化解决方案:

oct_two_am = datetime.datetime(2020, 10, 25, 2, 0)
oct_three_am = datetime.datetime(2020, 10, 25, 3, 0)

# generates 15mins data
oct_dls = pd.date_range(start=oct_two_am, end=oct_three_am, freq='15min', closed='left')

df.loc[df['dates'].isna(), 'dates'] = oct_dls
print (df)
                dates  values
0 2020-12-31 23:45:00    75.6
1 2021-01-01 00:00:00    74.7
2 2020-10-25 02:00:00    73.7
3 2020-10-25 02:15:00    72.3
4 2020-10-25 02:30:00    70.5
5 2020-10-25 02:45:00    68.2