Question

假设我有一个带有城市和名称的熊猫数据框。当然每个城市都会有很多名字，例如：

Chicago   John
Chicago   Mary
Chicago   Jane

我意识到我有1000个不同的城市，但是当我按名字分组并计算与约翰相关的城市数时，我只会看到998。我如何找到哪些城市没有“约翰”字样？

Answer 1

你可以做

df.groupby('cities').filter(lambda x : (x['name']!='John').all())

Answer 2

尝试groupby和query：

df = df.groupby('city')['names'].value_counts().unstack(fill_value=0)
#here you can replace whatever name you like to check
df.query("John==0").index