我对大熊猫的一些例子感到困惑。例如,这可以从我最近阅读的帖子中缩短:
df[df.duplicated()|df()]
我不明白为什么df
需要在外面:df[df.duplicated()]
vs只使用df.duplicated()
。在文档中我还没有看到第一个例子,所有内容都以df.something_doing()
格式显示。但我看到许多例子,如df[df.something_doing()]
,我不明白外面的df
是什么。
答案 0 :(得分:2)
df.duplicated()返回布尔值。如果满足所述条件,则它们提供带有True的掩码,否则为False。 如果您想要基于布尔掩码的数据帧切片,则需要:
df[df.duplicated()]
另一个简单的例子,考虑这个数据框
col1 id
0 1 a
1 0 a
2 1 a
3 1 b
如果您只想要列中的' id'是' a'
df.id == 'a'
会给你布尔掩码,但是
df[df.id == 'a']
将返回数据框
col1 id
0 1 a
1 0 a
2 1 a