python加入数据框

时间:2017-08-31 02:51:42

标签: python join dataframe

您好我有两个数据框如下

df1:

User_id        time          Activity
1            1-1-2017 12:30     Impression
1            2-3-2017 10:30     Impression
1            5-6-2017 00:02     Impression
2            2-10-2017 05:09    Impression 

df2:

User_id        time         Activity
1            3-3-2017 11:30     Click
1            7-3-2017 10:30     Click
2            6-5-2017 00:02     Click
2            6-19-2017 06:10    Click 

df1向用户展示了广告和df2点击广告的用户。我想在python中合并这两个dfs,这样我得到的用户在点击之前至少有一次展示。点击前的展示次数。第一印象和第一次点击之间的差异。

sampleoutput:

User  # impression timediff  
1        2          28 days
2        1          129 days

请帮助我使用合并功能以及条件。

1 个答案:

答案 0 :(得分:0)

您可以将最早的impressionclick之间的区别与:

>>> (df2.groupby('User_id').min()['time'] - df1.groupby('User_id').min()['time']).dt.days
User_id
1    60
2   114
Name: time, dtype: int64