有两个数据帧,比如df1和df2。
df1[Age]: 10, 20 30
df2[Income]: 100, 1000, 1500
如何创建一个新的数据帧df3,它包含来自df1的行,以便
df2.loc[k]['income'] >1000?
在上面给出的例子中,我会有
df3[Age]: 20, 30
同样,df4[Age, Income]: (20, 1000), (30, 1500)
谢谢。
答案 0 :(得分:0)
In [232]: df3 = df1.join(df2).query("Income >= 1000")
In [233]: df3
Out[233]:
Age Income
1 20 1000
2 30 1500
<强>更新强>
In [269]: idx = df2.index[df2.Income.ge(1000)]
In [270]: df3 = df1.loc[idx].join(df2.loc[idx])
In [271]: df3
Out[271]:
Age Income
1 20 1000
2 30 1500
或简单地说:
In [275]: df2.loc[df2.Income.ge(1000)].join(df1)
Out[275]:
Income Age
1 1000 20
2 1500 30