如何合并dataframe和date_range系列?

时间:2019-11-25 13:59:23

标签: python pandas

我有一个包含用户交易的数据框:

date       amount
2019-11-25 100
2019-11-25 40
2019-11-23 44
2019-10-30 1000

日期列有空白。这使时间间隔绘图变得有些奇怪。为了填补空白,我创建了Series:

allthosedays = pd.DataFrame({
    'date': pd.date_range(
        start = pd.Timestamp(df.date.min()),                        
        end = pd.Timestamp(df.date.max()),
        freq = 'D'
    )
})

然后我被卡住了。

如何合并我的数据框和系列。并用零填充不存在的金额值?

或者也许我做错了所有事情而没有创建系列而不解决问题?

1 个答案:

答案 0 :(得分:1)

  

这使时间间隔绘图变得有些奇怪。

我认为原因之一是重复的DatetimeIndex2019-11-25,所以应该有问题。

一种可能的解决方案是,每个日期时间都使用sum来聚合唯一值,例如sum,然后可以添加DataFrame.asfreq用于添加其他值(如有必要):

df1 = df.set_index('date').sum(level=0).sort_index()
print (df1)
            amount
date              
2019-10-30    1000
2019-11-23      44
2019-11-25     140

df2 = df.set_index('date').sum(level=0).sort_index().asfreq('D', fill_value=0)
print (df2)
            amount
date              
2019-10-30    1000
2019-10-31       0
2019-11-01       0
2019-11-02       0
2019-11-03       0
2019-11-04       0
2019-11-05       0
2019-11-06       0
2019-11-07       0
2019-11-08       0
2019-11-09       0
2019-11-10       0
2019-11-11       0
2019-11-12       0
2019-11-13       0
2019-11-14       0
2019-11-15       0
2019-11-16       0
2019-11-17       0
2019-11-18       0
2019-11-19       0
2019-11-20       0
2019-11-21       0
2019-11-22       0
2019-11-23      44
2019-11-24       0
2019-11-25     140

使用DataFrame.merge进行左连接,替换缺失的值,最后转换为索引:

df3 = allthosedays.merge(df, how='left').fillna({'amount':0}).astype({'amount':int})
print (df3)
         date  amount
0  2019-10-30    1000
1  2019-10-31       0
2  2019-11-01       0
3  2019-11-02       0
4  2019-11-03       0
5  2019-11-04       0
6  2019-11-05       0
7  2019-11-06       0
8  2019-11-07       0
9  2019-11-08       0
10 2019-11-09       0
11 2019-11-10       0
12 2019-11-11       0
13 2019-11-12       0
14 2019-11-13       0
15 2019-11-14       0
16 2019-11-15       0
17 2019-11-16       0
18 2019-11-17       0
19 2019-11-18       0
20 2019-11-19       0
21 2019-11-20       0
22 2019-11-21       0
23 2019-11-22       0
24 2019-11-23      44
25 2019-11-24       0
26 2019-11-25     100
27 2019-11-25      40