Pandas相当于SQL非equi JOIN

时间:2018-05-28 21:12:03

标签: python pandas dataframe join merge

所以我有两个数据框,我想合并在一起。

我正在合并3列,2是一个简单的连接。

joined_df = pd.merge(df1, df2, how='left', on=['name', 'city'])

我希望这是使用第三列,但它将是一个比较,如下所示:

joined_df = pd.merge(df1, df2, how='left',
on=['name', 'city', 'df1.year' >= 'df2.year_min'])

不确定这里的语法是什么。

如果是SQL,对我来说很容易。

SELECT * FROM df1
JOIN df2 on (df1.name = df2.name and df1.year = df2.year and df1.year > df2.year_min)

有任何帮助吗?

2 个答案:

答案 0 :(得分:2)

Pandas sudo apt install aptitude && sudo apt remove python3 && sudo apt autoremove && sudo aptitude install python3 仅支持equi-joins。您需要添加第二步来过滤结果,如下所示:

merge

答案 1 :(得分:0)

您可以使用merge_asof,默认为向后合并

schema.data