我有两个数据框,例如
>>>df1
datetime id
2018-01-01 1:00:11 abc
2018-01-01 12:00:00 flllds
>>>df2
datetime2 id
2018-01-01 1:30:11 abc
2018-01-01 1:30:32 abc
2018-01-01 2:30:32 abc
2018-01-01 12:00:00 flllds
我必须根据id
加入数据框,然后选择行datetime - datetime2
< 1小时
我的问题是我的数据框很大,所以当我得到MemoryError
时
首先合并,然后根据条件进行过滤。
有没有办法在合并期间限制数据框的大小?
df = pd.merge(df1,df2,on = ['id'])