我是Pandas的新手,我有一个问题!如果我想在B列中找到与A列不相似的最重复的字段怎么办?
Column A Column B
Sam Sam
Alex David
David David
Sarah Alice
Alice Sam
Sam Alice
Anna Sam
我想排除A列和B列中的名称是否相同,然后在B列中找到重复次数最多的名称。
答案 0 :(得分:0)
您似乎需要首先按isin
进行过滤,然后使用value_counts
按index
选择[]
值:
print (df)
Column A Column B
0 Sam Sam
1 Alex David
2 Alex Mary
3 David David
4 Sarah Alice
5 Alice Sam
6 Sam Alice
7 Sam Joe
8 Sam Joe
9 Anna Sam
print (df.loc[~df['Column B'].isin(df['Column A']), 'Column B'])
2 Mary
7 Joe
8 Joe
Name: Column B, dtype: object
df = df.loc[~df['Column B'].isin(df['Column A']), 'Column B'].value_counts().index[0]
print (df)
Joe