应用错误收集

Pandas使用掩码对数据帧进行子集化的最佳方法

时间：2015-10-13 13:29:05

标签： pandas subset mask masking

我有一个我要缩小的pandas数据集（删除x下的所有值）。

面具是df[my_column] > 50

我通常只使用df = df[mask]，但希望每次都避免复制，特别是因为它在函数中使用时容易出错（因为它只在函数范围内被更改）。

将数据集分配到位的最佳方法是什么？

我正在考虑的事情 df.drop(df.loc[mask].index, inplace = True)

有没有更好的方法来做到这一点，或者任何根本不起作用的情况？

2 个答案:

答案 0 :(得分：2)

您缺少inplace参数：

df.drop(df[df.my_column < 50].index, inplace = True)

答案 1 :(得分：0)

我认为这很有效。也许有更好的方法？

df = df.drop(df[df.my_column < 50].index)