熊猫语法例子混乱

时间:2017-03-15 18:07:49

标签: pandas

我对大熊猫的一些例子感到困惑。例如,这可以从我最近阅读的帖子中缩短:

df[df.duplicated()|df()]

我不明白为什么df需要在外面:df[df.duplicated()] vs只使用df.duplicated()。在文档中我还没有看到第一个例子,所有内容都以df.something_doing()格式显示。但我看到许多例子,如df[df.something_doing()],我不明白外面的df是什么。

1 个答案:

答案 0 :(得分:2)

df.duplicated()返回布尔值。如果满足所述条件,则它们提供带有True的掩码,否则为False。 如果您想要基于布尔掩码的数据帧切片,则需要:

df[df.duplicated()]

另一个简单的例子,考虑这个数据框

    col1  id
0   1     a
1   0     a
2   1     a
3   1     b

如果您只想要列中的' id'是' a'

df.id == 'a'

会给你布尔掩码,但是

df[df.id == 'a']

将返回数据框

    col1   id
0   1      a
1   0      a
2   1      a