我的df如下:
在[2]中:df OUT [2]:
A B C
0 b1 1 0
1 b2 1 0
2 b1 3 1
3 b1 2 1
4 b2 2 1
5 b2 4 1
我想使用pandas命令只根据B列选择元素:
在[2]中:df_new OUT [2]:
A B C
0 b1 1 0
1 b2 1 0
3 b1 2 1
4 b2 2 1
干杯, Behzad。
答案 0 :(得分:1)
使用DataFrame.duplicated
表示2列的布尔值掩码,keep=False
表示返回所有表格并按boolean indexing
过滤:
df = df[df.duplicated(['B', 'C'], keep=False)]
print (df)
A B C
0 b1 1 0
1 b2 1 0
3 b1 2 1
4 b2 2 1