如果日期完全一致,我们通常只需运行df1.join(df2)
。但是在我的数据集中,我与索引略有不匹配。
在df1
中,pandas.tseries.index.DatetimeIndex
格式为2004-07-07 20:00:00, 2004-07-08 20:00:00...
,而df2
pandas.tseries.index.DatetimeIndex
格式为2004-07-07, 2004-07-08,...
我想忽略小时分和秒并加入这两个data frames
。不会引发任何错误,但df2
上的2004-07-08 20:00:00
列会显示NaN值。如何加入这两个数据框?
答案 0 :(得分:1)
我认为最简单的解决方案是重新格式化一个或两个数据帧的日期时间列。也许您可以从第一个数据帧中删除时间,假设时间对您来说并不重要。 Here's a post which uses normalize
to achieve this.