这是我的数据框:
import pandas as pd
dates = ('2020-09-24','2020-10-19','2020-12-17','2021-03-17','2021-06-17','2021-09-17','2022-03-17','2022-09-20','2023-09-19','2024-09-17','2025-09-17','2026-09-17','2027-09-17','2028-09-19','2029-09-18','2030-09-17','2031-09-17','2032-09-17','2035-09-18','2040-09-18','2045-09-19')
factors = ('1','0.999994','0.999875','1.000166','1.000303','1.000438','1.00056','1.000817','1.001046','1.001412','1.001525','1.001334','1.000685','0.999376','0.997456','0.994626','0.991244','0.986754','0.982072','0.962028','0.925136')
df = pd.DataFrame()
df['dates']=dates
df['factors']=factors
df['dates'] = pd.to_datetime(df['dates'])
df.set_index(['dates'],inplace=True)
df
这是另一个具有固定间隔时间序列的数据帧
interpolated = pd.DataFrame(0, index=pd.date_range('2020-09-24', '2045-09-19', freq='3M'),columns=['result'])
目标是用第一张表中的三次样条插值来填充第二个数据框。 谢谢所有的想法
尝试
interpolated['result'] = df['factors'].interpolate(method='cubic')
但是,它只在内插数据框中提供NaN值。不确定如何正确地引用第一个表。
答案 0 :(得分:0)
首先,形状不匹配。由于df索引中的日期似乎都不与插值的日期匹配,因此您最终会在日期中填写NaN。我认为您想要更多类似合并或加入的内容,如这篇文章所述:Merging time series data by timestamp using numpy/pandas merge 和join也将有所帮助。