基于这个问题Drop row based on two columns conditions,否则,我想消除行数据的不同值。
我有dataframe
像这样:
df
Data1 Data2 Data3
A XX AA
A YY AA
B XX BB
B YY CC
C XX DD
C YY DD
D XX EE
D YY FF
我的预期结果如下:
Data1 Data2 Data3
A XX AA
A YY AA
C XX DD
C YY DD
怎么做?
答案 0 :(得分:2)
您可以使用groupby
:
df[df.groupby('Data1')['Data3'].transform('nunique').eq(1)]
df[df.duplicated(['Data1','Data3'],keep=False)]
Data1 Data2 Data3
0 A XX AA
1 A YY AA
4 C XX DD
5 C YY DD