Pandas在日期时间合并两个不同大小的数据帧

时间:2016-12-19 12:23:31

标签: python pandas join dataframe merge

我想在日期列上合并两个数据帧。

第一个数据帧包含日期时间:

    DateTime,Date,Hour

    2015-01-01 00:00:00 | 2015-01-01 | 00 
    2015-01-01 00:00:01 | 2015-01-01 | 01 

    ...

    2015-01-01 23:00:00 | 2015-01-01 | 23

第二个人每天坚持:

> Date,Col3
> 
> 2015-01-01 | daily something1
> 
> 2015-01-02 | daily something2

-

我想在Date列上合并,以便日期中的24小时将具有第二个数据帧所采用的相同日常功能。

2015-01-01 00:00:00 | 2015-01-01 | 00 |  daily something1

2015-01-01 01:00:00 | 2015-01-01 | 01 |  daily something1

...

2015-01-02 00:00:00 | 2015-01-01 | 23|  daily something2

可以通过编写一些代码来完成,但是我可以使用join或merge来完成吗?尝试用左,右连接来做但不能做到。

1 个答案:

答案 0 :(得分:0)

让我们以您描述的方式合并以下两个数据帧。我不知道是否有一个很好的oneliner来完成这个,我想看一个,但这种方法有效。

import pandas as pd

df = pd.DataFrame({'DATE': pd.date_range(start='2016-01-01 00:00:00',
                                         freq='12H', periods=10)})
df2 = pd.DataFrame({'DATE': pd.date_range(start='2016-01-01',
                                          freq='D', periods=5),
                    'VALUE': range(0,5)})

# extract the date from each column
df['DATE_DAY'] = df['DATE'].dt.date
# even though the df2 DATE column only shows the date, it's still in
# a different type (datetime64[ns]), so we have to convert it as well
df2['DATE_DAY'] = df2['DATE'].dt.date

tmp = df.merge(df2, on='DATE_DAY')
>>> tmp
               DATE_x     DATE_y    DATE_DAY  VALUE
0 2016-01-01 00:00:00 2016-01-01  2016-01-01      0
1 2016-01-01 12:00:00 2016-01-01  2016-01-01      0
2 2016-01-02 00:00:00 2016-01-02  2016-01-02      1
3 2016-01-02 12:00:00 2016-01-02  2016-01-02      1
4 2016-01-03 00:00:00 2016-01-03  2016-01-03      2
5 2016-01-03 12:00:00 2016-01-03  2016-01-03      2
6 2016-01-04 00:00:00 2016-01-04  2016-01-04      3
7 2016-01-04 12:00:00 2016-01-04  2016-01-04      3
8 2016-01-05 00:00:00 2016-01-05  2016-01-05      4
9 2016-01-05 12:00:00 2016-01-05  2016-01-05      4