我想在日期列上合并两个数据帧。
第一个数据帧包含日期时间:
DateTime,Date,Hour
2015-01-01 00:00:00 | 2015-01-01 | 00
2015-01-01 00:00:01 | 2015-01-01 | 01
...
2015-01-01 23:00:00 | 2015-01-01 | 23
第二个人每天坚持:
> Date,Col3
>
> 2015-01-01 | daily something1
>
> 2015-01-02 | daily something2
-
我想在Date列上合并,以便日期中的24小时将具有第二个数据帧所采用的相同日常功能。
2015-01-01 00:00:00 | 2015-01-01 | 00 | daily something1
2015-01-01 01:00:00 | 2015-01-01 | 01 | daily something1
...
2015-01-02 00:00:00 | 2015-01-01 | 23| daily something2
可以通过编写一些代码来完成,但是我可以使用join或merge来完成吗?尝试用左,右连接来做但不能做到。
答案 0 :(得分:0)
让我们以您描述的方式合并以下两个数据帧。我不知道是否有一个很好的oneliner来完成这个,我想看一个,但这种方法有效。
import pandas as pd
df = pd.DataFrame({'DATE': pd.date_range(start='2016-01-01 00:00:00',
freq='12H', periods=10)})
df2 = pd.DataFrame({'DATE': pd.date_range(start='2016-01-01',
freq='D', periods=5),
'VALUE': range(0,5)})
# extract the date from each column
df['DATE_DAY'] = df['DATE'].dt.date
# even though the df2 DATE column only shows the date, it's still in
# a different type (datetime64[ns]), so we have to convert it as well
df2['DATE_DAY'] = df2['DATE'].dt.date
tmp = df.merge(df2, on='DATE_DAY')
>>> tmp
DATE_x DATE_y DATE_DAY VALUE
0 2016-01-01 00:00:00 2016-01-01 2016-01-01 0
1 2016-01-01 12:00:00 2016-01-01 2016-01-01 0
2 2016-01-02 00:00:00 2016-01-02 2016-01-02 1
3 2016-01-02 12:00:00 2016-01-02 2016-01-02 1
4 2016-01-03 00:00:00 2016-01-03 2016-01-03 2
5 2016-01-03 12:00:00 2016-01-03 2016-01-03 2
6 2016-01-04 00:00:00 2016-01-04 2016-01-04 3
7 2016-01-04 12:00:00 2016-01-04 2016-01-04 3
8 2016-01-05 00:00:00 2016-01-05 2016-01-05 4
9 2016-01-05 12:00:00 2016-01-05 2016-01-05 4