放置行保留类似值列数据

时间:2019-06-23 06:14:25

标签: python pandas row

基于这个问题Drop row based on two columns conditions,否则,我想消除行数据的不同值。

我有dataframe像这样:

df
Data1   Data2   Data3
A       XX      AA
A       YY      AA
B       XX      BB
B       YY      CC
C       XX      DD
C       YY      DD
D       XX      EE
D       YY      FF

我的预期结果如下:

Data1   Data2   Data3
A       XX      AA
A       YY      AA
C       XX      DD
C       YY      DD

怎么做?

1 个答案:

答案 0 :(得分:2)

您可以使用groupby

df[df.groupby('Data1')['Data3'].transform('nunique').eq(1)]

duplicated()

df[df.duplicated(['Data1','Data3'],keep=False)]

  Data1 Data2 Data3
0     A    XX    AA
1     A    YY    AA
4     C    XX    DD
5     C    YY    DD