Question

基于这个问题Drop row based on two columns conditions，否则，我想消除行数据的不同值。

我有dataframe像这样：

df
Data1   Data2   Data3
A       XX      AA
A       YY      AA
B       XX      BB
B       YY      CC
C       XX      DD
C       YY      DD
D       XX      EE
D       YY      FF

我的预期结果如下：

Data1   Data2   Data3
A       XX      AA
A       YY      AA
C       XX      DD
C       YY      DD

怎么做？

Answer 1

您可以使用groupby：

df[df.groupby('Data1')['Data3'].transform('nunique').eq(1)]

或duplicated()：

df[df.duplicated(['Data1','Data3'],keep=False)]

  Data1 Data2 Data3
0     A    XX    AA
1     A    YY    AA
4     C    XX    DD
5     C    YY    DD

放置行保留类似值列数据

1 个答案: