从pandas.dataframe中删除低频值

时间:2015-09-10 20:28:37

标签: python pandas

如何从pandas.DataFrame中的列中删除很少发生的值,即频率较低的值?例如:

In [4]: df[col_1].value_counts()

Out[4]: 0       189096
        1       110500
        2        77218
        3        61372
              ...
        2065         1
        2067         1
        1569         1
        dtype: int64

所以,我的问题是:如何删除2065, 2067, 1569等其他值?我如何为包含.value_counts()的所有列执行此操作?

更新: 关于'低'我的意思是像2065这样的价值观。该值出现在col_1 1(一)次,我想删除这样的值。

0 个答案:

没有答案