Pandas使用掩码对数据帧进行子集化的最佳方法

时间:2015-10-13 13:29:05

标签: pandas subset mask masking

我有一个我要缩小的pandas数据集(删除x下的所有值)。

面具是df[my_column] > 50

我通常只使用df = df[mask],但希望每次都避免复制,特别是因为它在函数中使用时容易出错(因为它只在函数范围内被更改)。

将数据集分配到位的最佳方法是什么?

我正在考虑的事情 df.drop(df.loc[mask].index, inplace = True)

有没有更好的方法来做到这一点,或者任何根本不起作用的情况?

2 个答案:

答案 0 :(得分:2)

您缺少inplace参数:

df.drop(df[df.my_column < 50].index, inplace = True)

答案 1 :(得分:0)

我认为这很有效。也许有更好的方法?

df = df.drop(df[df.my_column < 50].index)