如何在熊猫中找到列重复最多的字段?

时间:2017-05-31 13:49:25

标签: pandas

我是Pandas的新手,我有一个问题!如果我想在B列中找到与A列不相似的最重复的字段怎么办?

Column A       Column B
 Sam             Sam
 Alex            David
 David           David
 Sarah           Alice
 Alice           Sam
 Sam             Alice
 Anna            Sam

我想排除A列和B列中的名称是否相同,然后在B列中找到重复次数最多的名称。

1 个答案:

答案 0 :(得分:0)

您似乎需要首先按isin进行过滤,然后使用value_countsindex选择[]值:

print (df)
  Column A Column B
0      Sam      Sam
1     Alex    David
2     Alex     Mary
3    David    David
4    Sarah    Alice
5    Alice      Sam
6      Sam    Alice
7      Sam      Joe
8      Sam      Joe
9     Anna      Sam

print (df.loc[~df['Column B'].isin(df['Column A']), 'Column B'])
2    Mary
7     Joe
8     Joe
Name: Column B, dtype: object


df = df.loc[~df['Column B'].isin(df['Column A']), 'Column B'].value_counts().index[0]
print (df)
Joe