我有一个df
,如下所示:
dates values
2020-12-31 23:45:00 75.6
2021-01-01 00:00:00 74.7
NaT 73.7
NaT 72.3
NaT 70.5
NaT 68.2
我要用我制作的如下序列替换NaT
值:
oct_two_am = datetime.datetime(2020, 10, 25, 2, 0)
oct_three_am = datetime.datetime(2020, 10, 25, 3, 0)
# generates 15mins data
oct_dls = pd.date_range(start=oct_two_am, end=oct_three_am, freq='15min', closed='left')
oct_dls = oct_dls.to_series().reset_index(drop=True)
这给了我以下系列oct_dls
:
oct_dls
Out[26]:
0 2020-10-25 02:00:00
1 2020-10-25 02:15:00
2 2020-10-25 02:30:00
3 2020-10-25 02:45:00
dtype: datetime64[ns]
现在,我想用数据集NaTs
中的值替换数据帧df
中的oct_dls
我尝试过:
df['dates'] = df['dates'].fillna(value=oct_dls)
但这不起作用。
感谢您的帮助。谢谢
答案 0 :(得分:5)
由于索引不匹配,这就是为什么无法填充空值的原因。
index
匹配是熊猫分配中的隐藏键之一。
oct_dls.index=df.index[df['dates'].isnull()]
df['dates'] = df['dates'].fillna(value=oct_dls)
答案 1 :(得分:4)
如果缺失值的长度与DatetimeIndex
的新值数匹配,请使用BooleanToVisibilityConverter
并按DataFrame.loc
进行过滤,这样可以简化解决方案:
oct_two_am = datetime.datetime(2020, 10, 25, 2, 0)
oct_three_am = datetime.datetime(2020, 10, 25, 3, 0)
# generates 15mins data
oct_dls = pd.date_range(start=oct_two_am, end=oct_three_am, freq='15min', closed='left')
df.loc[df['dates'].isna(), 'dates'] = oct_dls
print (df)
dates values
0 2020-12-31 23:45:00 75.6
1 2021-01-01 00:00:00 74.7
2 2020-10-25 02:00:00 73.7
3 2020-10-25 02:15:00 72.3
4 2020-10-25 02:30:00 70.5
5 2020-10-25 02:45:00 68.2